Gemini ประกาศเปิดตัวฟีเจอร์ใหม่สำหรับการสร้างสรรค์เสียงดนตรี โดยผสานการทำงานร่วมกับ Lyria 3 ซึ่งเป็นโมเดลสร้างเสียงดนตรี (Generative music model) ขั้นสูงรุ่นล่าสุดจาก Google DeepMind ฟีเจอร์นี้เปิดให้ใช้งานแล้วในสถานะเบต้า (Beta) ช่วยให้ผู้ใช้งานทั่วไปสามารถสร้างแทร็กเพลงคุณภาพสูงความยาว 30 วินาทีได้อย่างรวดเร็ว เพียงแค่พิมพ์ข้อความอธิบายไอเดีย หรืออัปโหลดรูปภาพและวิดีโอเพื่อให้ระบบนำไปประมวลผลเป็นแรงบันดาลใจในการแต่งเพลง
โมเดล Lyria 3 ได้รับการพัฒนาและปรับปรุงประสิทธิภาพจากโมเดลรุ่นก่อนหน้าใน 3 ส่วนสำคัญ ดังนี้
- ระบบสามารถสร้างเนื้อร้องให้สอดคล้องกับคำสั่ง (Prompt) ได้โดยอัตโนมัติ ทำให้ผู้ใช้ไม่จำเป็นต้องแต่งเนื้อเพลงเอง
- ผู้ใช้งานมีอิสระในการควบคุมความคิดสร้างสรรค์ได้มากขึ้น ทั้งการกำหนดสไตล์เพลง เสียงร้อง และจังหวะ (Tempo)
- แทร็กเพลงที่ถูกสร้างขึ้นจะมีความสมจริงและมีความซับซ้อนในเชิงโครงสร้างดนตรีมากยิ่งขึ้น
สำหรับการใช้งาน ผู้ใช้สามารถป้อนคำสั่งข้อความ (Text to track) เพื่อระบุแนวเพลง อารมณ์ หรือแม้แต่เรื่องราวความทรงจำเฉพาะตัว เพื่อให้ระบบประพันธ์เพลงและเนื้อร้องที่ตรงกับบรรยากาศที่ต้องการ นอกจากนี้ยังรองรับการอัปโหลดสื่อ (From photos and videos to track) โดยระบบของ Gemini จะวิเคราะห์บริบทจากรูปภาพหรือวิดีโอที่ผู้ใช้อัปโหลดเพื่อนำไปสร้างแทร็กเพลงพร้อมเนื้อร้องที่เข้ากันอย่างสมบูรณ์แบบ แทร็กความยาว 30 วินาทีที่ระบบสร้างขึ้นจะมาพร้อมกับภาพหน้าปก (Cover art) ที่ปรับแต่งเฉพาะตัวซึ่งสร้างโดยโมเดล Nano Banana เพื่ออำนวยความสะดวกในการดาวน์โหลดและแชร์ลิงก์ส่งต่อให้ผู้อื่น
ครีเอเตอร์บน YouTube ยังสามารถใช้งานโมเดล Lyria 3 ผ่านฟีเจอร์ Dream Track ได้เช่นกัน โดยขณะนี้เปิดให้ใช้งานแล้วในสหรัฐอเมริกา และกำลังทยอยเปิดให้ครีเอเตอร์ในประเทศอื่นๆ ได้ใช้งาน ซึ่งจะช่วยยกระดับการสร้างสรรค์เสียงประกอบใน YouTube Shorts ไม่ว่าจะเป็นการสร้างท่อนร้องหรือดนตรีบรรเลงพื้นหลัง
ในด้านความปลอดภัยและการยืนยันตัวตน แทร็กดนตรีทั้งหมดที่ถูกสร้างผ่านแอปพลิเคชัน Gemini จะได้รับการฝังลายน้ำดิจิทัล SynthID ซึ่งเป็นเทคโนโลยีลายน้ำที่มองไม่เห็นและไม่ได้ยินด้วยสัมผัสปกติ เพื่อใช้ระบุเนื้อหาที่สร้างจาก AI ของ Google นอกจากนี้ผู้ใช้ยังสามารถอัปโหลดไฟล์เสียงเพื่อสอบถาม Gemini ว่าไฟล์ดังกล่าวถูกสร้างโดย AI ของ Google หรือไม่ ซึ่งระบบจะทำการตรวจสอบหา SynthID และใช้เหตุผลของระบบในการให้คำตอบ ช่วยขยายขีดความสามารถในการตรวจสอบเนื้อหาให้ครอบคลุมทั้งรูปภาพ วิดีโอ และเสียง
การพัฒนา Lyria 3 ดำเนินการภายใต้ความร่วมมือกับชุมชนอุตสาหกรรมดนตรีอย่างมีความรับผิดชอบ โดยให้ความสำคัญกับข้อตกลงและลิขสิทธิ์อย่างเคร่งครัด ระบบนี้ถูกออกแบบมาเพื่อการสร้างสรรค์ผลงานที่เป็นต้นฉบับ ไม่ได้มีจุดประสงค์เพื่อลอกเลียนแบบศิลปินที่มีอยู่จริง หากผู้ใช้พิมพ์ชื่อศิลปินเฉพาะเจาะจงลงในคำสั่ง ระบบจะรับข้อความนั้นเป็นเพียงแรงบันดาลใจเพื่อสร้างแทร็กในสไตล์หรืออารมณ์ที่คล้ายคลึงกันเท่านั้น นอกจากนี้ยังมีระบบฟิลเตอร์สำหรับคัดกรองเนื้อหา และมีช่องทางให้ผู้ใช้รายงานผลลัพธ์ที่อาจละเมิดสิทธิ์ ทั้งนี้ ผู้ใช้งานจะต้องปฏิบัติตามข้อกำหนดการให้บริการและนโยบายการใช้งาน AI แบบสร้างสรรค์ ซึ่งห้ามมิให้ละเมิดทรัพย์สินทางปัญญาและสิทธิ์ความเป็นส่วนตัวอย่างเด็ดขาด
ปัจจุบันฟีเจอร์การสร้างเพลงด้วย Lyria 3 บนแอปพลิเคชัน Gemini เปิดให้ใช้งานสำหรับผู้ที่มีอายุ 18 ปีขึ้นไป โดยรองรับภาษาอังกฤษ เยอรมัน สเปน ฝรั่งเศส ฮินดี ญี่ปุ่น เกาหลี และโปรตุเกส และมีแผนที่จะพัฒนาคุณภาพพร้อมขยายการรองรับภาษาอื่นๆ เพิ่มเติมในอนาคต ฟีเจอร์นี้เริ่มเปิดใช้งานบนเดสก์ท็อปแล้ววันนี้ และจะทยอยอัปเดตบนแอปพลิเคชันมือถือในช่วงไม่กี่วันข้างหน้า สำหรับผู้ใช้ที่สมัครบริการ Google AI Plus, Pro และ Ultra จะได้รับสิทธิ์และโควตาการใช้งานในระดับที่สูงกว่า
ที่มา: Google Blog