Google ประกาศเปิดตัว Gemini 3.5 Live Translate โมเดลเสียงเวอร์ชันล่าสุด รองรับการแปลภาษาพูดแบบเรียลไทม์มากกว่า 70 ภาษา โมเดลทำงานครอบคลุมการตรวจจับภาษาอัตโนมัติ สร้างเสียงแปลลื่นไหลเป็นธรรมชาติ พร้อมรักษาระดับเสียง จังหวะ และน้ำเสียงตามผู้พูดต้นฉบับ ระบบทำงานต่อเนื่องตลอดเวลา ไม่หยุดรอให้ผู้พูดจบประโยค ช่วยลดความล่าช้าจากการรอประมวลผลบริบท
ฟีเจอร์นี้เปิดให้ Developer ทดสอบผ่าน Gemini Live API และ Google AI Studio แพลตฟอร์มเชื่อมต่อระบบสื่อสารนำเครื่องมือไปปรับใช้กับแอปพลิเคชันเสียง บริษัท Grab เริ่มทดสอบโมเดลนี้อำนวยความสะดวกการสื่อสารระหว่างคนขับและผู้โดยสาร Philipp Kandal ประธานเจ้าหน้าที่ฝ่ายผลิตภัณฑ์ ระบุถึงความพึงพอใจต่อความแม่นยำและเวลาหน่วงต่ำระหว่างการใช้งาน
บริการประชุมออนไลน์ Google Meet เตรียมอัปเดตโมเดลแปลเสียงใหม่สำหรับลูกค้าธุรกิจกลุ่ม Google Workspace ภายในเดือนนี้ (กลุ่มทดสอบแบบจำกัด) ระบบใหม่ปรับปรุงประสิทธิภาพหลายด้าน ดังนี้
- รองรับการใช้งานมากกว่า 70 ภาษา เพิ่มจากเดิม 5 ภาษา
- จับคู่แปลภาษาไขว้กันมากกว่า 2,000 รูปแบบในหนึ่งการประชุม
- ปรับหน้าต่างการใช้งานใหม่รองรับการเข้าถึงระบบแปลเสียงรวดเร็วขึ้น
ผู้ใช้งานทั่วไปบน Android และ iOS สามารถใช้งานผ่านแอปพลิเคชัน Google Translate ระบบส่งเสียงแปลผ่านหูฟังพร้อมจำลองน้ำเสียงต้นฉบับ ผู้ใช้งาน Android มีฟีเจอร์เสริม Listening mode (โหมดรับฟังเสียงแปลผ่านลำโพงโทรศัพท์) อำนวยความสะดวกการฟังเสียงแปลแบบส่วนตัวเสมือนคุยโทรศัพท์ทั่วไป
ไฟล์เสียงทั้งหมดจากโมเดลผ่านการฝังลายน้ำ SynthID (เทคโนโลยีตรวจสอบเนื้อหาจากระบบ AI ฝังในไฟล์เสียง) ป้องกันการนำเนื้อหาไปสร้างข้อมูลเท็จ
ที่มา: Google Blog