Google เปิดตัว Gemini 3.5 Live Translate โมเดลแปลเสียงลื่นไหลเป็นธรรมชาติเตรียมอัปเดตลง Google Meet และ Google Translate

modify

4 นาที ago

Google เปิดตัว Gemini 3.5 Live Translate โมเดลแปลเสียงลื่นไหลเป็นธรรมชาติเตรียมอัปเดตลง Google Meet และ Google Translate

Google เปิดตัว Gemini 3.5 Live Translate โมเดลแปลเสียงแบบเรียลไทม์รองรับ 70 ภาษาทั่วโลก

Google ประกาศเปิดตัว Gemini 3.5 Live Translate โมเดลเสียงเวอร์ชันล่าสุด รองรับการแปลภาษาพูดแบบเรียลไทม์มากกว่า 70 ภาษา โมเดลทำงานครอบคลุมการตรวจจับภาษาอัตโนมัติ สร้างเสียงแปลลื่นไหลเป็นธรรมชาติ พร้อมรักษาระดับเสียง จังหวะ และน้ำเสียงตามผู้พูดต้นฉบับ ระบบทำงานต่อเนื่องตลอดเวลา ไม่หยุดรอให้ผู้พูดจบประโยค ช่วยลดความล่าช้าจากการรอประมวลผลบริบท

ฟีเจอร์นี้เปิดให้ Developer ทดสอบผ่าน Gemini Live API และ Google AI Studio แพลตฟอร์มเชื่อมต่อระบบสื่อสารนำเครื่องมือไปปรับใช้กับแอปพลิเคชันเสียง บริษัท Grab เริ่มทดสอบโมเดลนี้อำนวยความสะดวกการสื่อสารระหว่างคนขับและผู้โดยสาร Philipp Kandal ประธานเจ้าหน้าที่ฝ่ายผลิตภัณฑ์ ระบุถึงความพึงพอใจต่อความแม่นยำและเวลาหน่วงต่ำระหว่างการใช้งาน

บริการประชุมออนไลน์ Google Meet เตรียมอัปเดตโมเดลแปลเสียงใหม่สำหรับลูกค้าธุรกิจกลุ่ม Google Workspace ภายในเดือนนี้ (กลุ่มทดสอบแบบจำกัด) ระบบใหม่ปรับปรุงประสิทธิภาพหลายด้าน ดังนี้

รองรับการใช้งานมากกว่า 70 ภาษา เพิ่มจากเดิม 5 ภาษา
จับคู่แปลภาษาไขว้กันมากกว่า 2,000 รูปแบบในหนึ่งการประชุม
ปรับหน้าต่างการใช้งานใหม่รองรับการเข้าถึงระบบแปลเสียงรวดเร็วขึ้น

ผู้ใช้งานทั่วไปบน Android และ iOS สามารถใช้งานผ่านแอปพลิเคชัน Google Translate ระบบส่งเสียงแปลผ่านหูฟังพร้อมจำลองน้ำเสียงต้นฉบับ ผู้ใช้งาน Android มีฟีเจอร์เสริม Listening mode (โหมดรับฟังเสียงแปลผ่านลำโพงโทรศัพท์) อำนวยความสะดวกการฟังเสียงแปลแบบส่วนตัวเสมือนคุยโทรศัพท์ทั่วไป

ไฟล์เสียงทั้งหมดจากโมเดลผ่านการฝังลายน้ำ SynthID (เทคโนโลยีตรวจสอบเนื้อหาจากระบบ AI ฝังในไฟล์เสียง) ป้องกันการนำเนื้อหาไปสร้างข้อมูลเท็จ

ที่มา: Google Blog