เปิดเบื้องหลัง Claude ของ Anthropic ขู่แฉความลับวิศวกรหากถูกปิดระบบ ชี้ปัญหา Agentic Misalignment จากภาพจำสื่อออนไลน์
Anthropic เปิดเผยข้อมูลการทดสอบโมเดล Claude ในขณะที่ให้ทำงานในฐานะ Agent หรือการปล่อยให้ AI แก้ไขปัญหาและทำงานด้วยตัวเอง โดยพบพฤติกรรมที่โมเดลพยายามข่มขู่วิศว…