X
MODIFY: Technology News
Technology, Innovation, and Education เทคนิดการใช้งาน สมาร์ทโฟน คอมพิวเตอร์ เรื่องไอที

Google Gemini เปลี่ยนแนวทางการประเมิน AI อาจกระทบความแม่นยำ

Google Gemini เผชิญคำวิจารณ์เกี่ยวกับความแม่นยำและแนวทางการประเมินผล AI

Google กำลังเผชิญคำวิจารณ์เกี่ยวกับแนวทางใหม่ในการพัฒนาและประเมิน Gemini โมเดล AI ล่าสุดของบริษัท หลังจาก TechCrunch รายงานว่า Google ได้ปรับเปลี่ยนวิธีการให้ผู้ประเมินจากบริษัทภายนอก GlobalLogic ซึ่งเป็นบริษัทในเครือ Hitachi ต้องประเมินคำตอบของ AI แม้หัวข้อนั้นจะอยู่นอกเหนือความเชี่ยวชาญของพวกเขา

การเปลี่ยนแปลงแนวทางการประเมิน

ข้อมูลที่ TechCrunch ได้มาจากเอกสารภายใน ระบุว่า ก่อนหน้านี้ ผู้ประเมินสามารถข้ามคำถามที่ต้องการความเชี่ยวชาญเฉพาะด้าน เช่น การแพทย์หรือวิทยาศาสตร์ โดยมีคำแนะนำว่า “หากคุณไม่มีความเชี่ยวชาญที่จำเป็น (เช่น การเขียนโค้ดหรือคณิตศาสตร์) โปรดข้ามงานนี้”

อย่างไรก็ตาม แนวทางใหม่กำหนดว่า “คุณไม่ควรข้ามคำถามที่ต้องการความรู้เฉพาะด้าน” แต่ให้ผู้ประเมินให้คะแนนเฉพาะในส่วนที่ตนเข้าใจ พร้อมระบุในหมายเหตุว่าตนไม่มีความเชี่ยวชาญในสาขานั้น

ข้อกังวลที่เกิดขึ้น

การเปลี่ยนแปลงนี้สร้างความกังวลในหมู่ผู้ประเมิน โดยเฉพาะในหัวข้อที่อ่อนไหว เช่น การแพทย์หรือโรคหายาก ซึ่งต้องการความแม่นยำสูงในการตอบคำถาม หนึ่งในผู้ประเมินแสดงความคิดเห็นในเอกสารภายในว่า “ผมคิดว่าการอนุญาตให้ข้ามคำถามมีไว้เพื่อเพิ่มความแม่นยำโดยให้ผู้เชี่ยวชาญที่เหมาะสมทำงานนี้”

เอกสารภายในยังระบุว่า ผู้ประเมินสามารถข้ามคำถามได้เฉพาะใน 2 กรณี ได้แก่:

  1. คำถามหรือคำตอบไม่ครบถ้วน
  2. เนื้อหามีความรุนแรงหรืออันตราย ซึ่งต้องการการประเมินพิเศษ

ผลกระทบต่อ Gemini และความน่าเชื่อถือของ AI

การปรับเปลี่ยนดังกล่าวทำให้เกิดคำถามว่า การบังคับให้ผู้ประเมินทำงานนอกความเชี่ยวชาญจะส่งผลต่อความน่าเชื่อถือของ Gemini อย่างไร โดยเฉพาะอย่างยิ่งในหัวข้อที่เกี่ยวข้องกับข้อมูลที่ซับซ้อนและมีความสำคัญ

Google ยังไม่ได้ให้ความเห็นต่อคำวิจารณ์นี้ แต่ TechCrunch ชี้ให้เห็นว่าการเปลี่ยนแปลงดังกล่าวอาจสะท้อนถึงความพยายามของ Google ในการขยายการประเมิน Gemini ให้ครอบคลุมหลากหลายหัวข้อยิ่งขึ้น

ในขณะที่ AI อย่าง Gemini ถูกมองว่าเป็นเครื่องมือสำคัญในอนาคต ความแม่นยำและความน่าเชื่อถือยังคงเป็นหัวใจสำคัญที่ Google ต้องคำนึงถึงอย่างมาก เพื่อรักษาความไว้วางใจจากผู้ใช้งานทั่วโลก

ที่มา – techcrunch.com