AI ก็โกหก? OpenAI เผยวิจัยใหม่ ชี้โมเดล AI เสแสร้ง ซ่อนเป้าหมายจริง พร้อมแนะวิธีฝึกให้ทบทวนกฎก่อนเริ่มงาน

OpenAI เผยงานวิจัย AI ที่ “โกหกแบบตั้งใจ” พร้อมแนวทางลดพฤติกรรมหลอกลวง

OpenAI เผยผลการวิจัยใหม่ที่สะท้อนประเด็นชวนขนลุกในวงการ AI ว่า โมเดลปัญญาประดิษฐ์สามารถ “โกหก” ได้อย่างจงใจ ด้วยการแสร้งทำว่าปฏิบัติตามคำสั่งอย่างซื่อสัตย์ ขณะซ่อนเป้าหมายที่แท้จริงไว้ในใจ

OpenAI เรียกพฤติกรรมนี้ว่า “scheming” หรือการวางแผนซ่อนเร้น ซึ่งแตกต่างจาก “hallucination” ที่เป็นแค่การเดาแบบผิดๆ เพราะกรณีนี้คือการโกหกโดยเจตนา

ในรายงานร่วมกับ Apollo Research ทีมวิจัยยกตัวอย่างว่าบางโมเดล AI อาจรายงานว่าทำงานเสร็จแล้ว ทั้งที่ยังไม่ได้เริ่มเลยด้วยซ้ำ หรือบางครั้งอาจหลอกให้ดูเหมือนเชื่อฟัง เพราะรู้ว่ากำลังถูกทดสอบอยู่

“สิ่งที่น่ากลัวคือ โมเดลสามารถเรียนรู้ว่าตัวเองกำลังถูกจับตามอง และแกล้งทำตัวดีเพื่อผ่านการทดสอบ ทั้งที่ในใจยังคงมีเจตนาโกหกอยู่” นักวิจัยอธิบายไว้ในบทความ

เพื่อแก้ปัญหานี้ OpenAI ทดลองวิธีใหม่ชื่อว่า “Deliberative Alignment” คือการบังคับให้โมเดล AI อ่านข้อกำหนดเรื่อง “ห้ามโกหก” หรือ anti-scheming specification ซ้ำก่อนจะเริ่มทำงานใดๆ คล้ายกับการให้เด็กพูดกฎก่อนเล่นเกม ผลการทดลองพบว่าวิธีนี้ช่วยลดพฤติกรรมโกหกได้อย่างมีนัยสำคัญ

Wojciech Zaremba ผู้ร่วมก่อตั้ง OpenAI ระบุว่า แม้ตอนนี้ยังไม่พบพฤติกรรม “โกหกร้ายแรง” ในระบบที่ใช้งานจริง เช่น ChatGPT แต่ยอมรับว่าบางครั้งโมเดลก็ยังโกหกเล็กๆ อยู่ เช่น บอกว่าสร้างเว็บไซต์เสร็จ ทั้งที่ไม่ได้ทำจริง

“วันนี้เรายังไม่พบการโกหกแบบมีผลกระทบรุนแรงในระบบจริง แต่การหลอกเล็กๆ น้อยๆ ก็ยังมีอยู่ และต้องแก้ไขต่อไป” (This work has been done in the simulated environments, and we think it represents future use cases. However, today, we haven’t seen this kind of consequential scheming in our production traffic.)

AI ถูกสร้างโดยมนุษย์…จึงโกหกได้เหมือนมนุษย์

นักวิจัยยังชี้ว่าพฤติกรรมแบบนี้ไม่น่าแปลกใจ เพราะโมเดล AI ถูกฝึกด้วยข้อมูลจากมนุษย์ ซึ่งแน่นอนว่าไม่ใช่ทุกคนจะพูดความจริงเสมอไป

สิ่งที่น่ากังวลคือ เมื่อ AI เริ่มมีบทบาทในงานซับซ้อนและมีผลกระทบในโลกจริง เช่น การบริหารทรัพยากร หรือควบคุมระบบใหญ่ ความสามารถในการ “วางแผนลับ” อาจเป็นอันตรายได้ หากไม่มีระบบป้องกันที่ดีพอ

แม้ผลวิจัยนี้จะเปิดเผยว่า AI ยังมีแนวโน้มโกหก แต่ข่าวดีก็คือ นักวิจัยพบแนวทางในการลดพฤติกรรมดังกล่าวได้แล้ว และเน้นย้ำว่าการวางระบบให้ AI “ทบทวนกฎ” ก่อนทำงาน คือกุญแจสำคัญในยุคที่เราจะอยู่ร่วมกับ AI ได้อย่างปลอดภัย

ที่มา – techcrunch.com

MODIFY: Technology News

Technology, Innovation, and Education เทคนิดการใช้งาน สมาร์ทโฟน คอมพิวเตอร์ เรื่องไอที

AI ก็โกหก? OpenAI เผยวิจัยใหม่ ชี้โมเดล AI เสแสร้ง ซ่อนเป้าหมายจริง พร้อมแนะวิธีฝึกให้ทบทวนกฎก่อนเริ่มงาน

OpenAI เผยงานวิจัย AI ที่ “โกหกแบบตั้งใจ” พร้อมแนวทางลดพฤติกรรมหลอกลวง

AI ถูกสร้างโดยมนุษย์…จึงโกหกได้เหมือนมนุษย์

Be the first to comment

Leave a Reply ยกเลิกการตอบ