NVIDIA เปิดตัว Nemotron 3 Super โมเดล Hybrid Mamba-Transformer MoE ออกแบบมาเพื่อแก้ปัญหา Context Explosion ในระบบ Multi-agent ประสิทธิภาพสูงเพื่อระบบ Agentic AI
NVIDIA ประกาศเปิดตัว Nemotron 3 Super โมเดลภาษาอัจฉริยะรุ่นล่าสุดที่ออกแบบมาเพื่อเป็นหัวใจหลักของระบบ Agentic AI หรือเอไอที่สามารถวางแผนและทำงานแทนมนุษย์ได้อย่างอิสระ โดยโมเดลนี้ถูกสร้างขึ้นเพื่อแก้จุดอ่อนสำคัญของ AI ในปัจจุบัน นั่นคือการหลงลืมเป้าหมายเมื่อต้องทำงานต่อเนื่องยาวนาน ซึ่งมักเกิดในระบบที่ใช้เอไอหลายตัวทำงานร่วมกัน (Multi-agent)
ความโดดเด่นของ Nemotron 3 Super คือการเป็นโมเดลแบบ Open Source ขนาด 120B ที่มีประสิทธิภาพสูงกว่ารุ่นเดิมถึง 5 เท่า และมาพร้อมกับความสามารถในการอ่านข้อมูลปริมาณมหาศาลได้สูงถึง 1 ล้านโทเค็น (1M context window) ทำให้เอไอสามารถประมวลผลเอกสารทั้งกองหรือโค้ดโปรแกรมทั้งชุดได้โดยไม่เกิดอาการสับสน
3 นวัตกรรมที่ทำให้ Nemotron 3 Super ฉลาดและประหยัดกว่าเดิม
- โครงสร้างแบบลูกผสม (Hybrid Mamba-Transformer): NVIDIA นำเทคโนโลยี Mamba ที่เด่นเรื่องความเร็วในการอ่านข้อมูลยาวๆ มาผสมกับ Transformer ที่เด่นเรื่องความแม่นยำในการจดจำรายละเอียด ผลลัพธ์ที่ได้คือโมเดลที่ทั้งเร็วและไม่พลาดประเด็นสำคัญแม้จะซ่อนอยู่ในข้อมูลมหาศาล
- ระบบ Latent MoE (ผู้เชี่ยวชาญเฉพาะทาง): แทนที่จะใช้พลังการประมวลผลทั้งหมดไปกับทุกคำถาม โมเดลนี้จะดึงเฉพาะ “ผู้เชี่ยวชาญเฉพาะด้าน” ภายในตัวออกมาตอบ ทำให้ทำงานได้ละเอียดกว่าเดิม 4 เท่าในขณะที่ใช้ทรัพยากรเท่าเดิม
- การคาดเดาล่วงหน้า (Multi-token Prediction): โมเดลถูกฝึกให้คิดล่วงหน้าหลายขั้นตอนพร้อมกัน ไม่ใช่แค่คิดทีละคำเหมือน AI ทั่วไป ช่วยให้การเขียนโค้ดหรือการวางแผนทำได้รวดเร็วขึ้นสูงสุด 3 เท่า

เปลี่ยนเอไอให้เป็นผู้ช่วยที่ทำงานได้จริง
ปัญหาหนึ่งที่นักพัฒนาเจอคือ “Thinking Tax” หรือการที่เอไอใช้เวลาคิดนานเกินไปจนทำงานร่วมกับมนุษย์ได้ยาก Nemotron 3 Super จึงถูกฝึกฝนผ่านสภาพแวดล้อมจำลองกว่า 1.2 ล้านครั้งเพื่อให้เข้าใจขั้นตอนการทำงานจริง (Workflow) เช่น การเขียนโปรแกรม หรือการตรวจสอบความปลอดภัยทางไซเบอร์ ทำให้โมเดลสามารถสร้างคำตอบที่มีตรรกะและตรวจสอบความถูกต้องได้เอง
ปัจจุบัน NVIDIA ได้เปิดให้นักพัฒนาทั่วโลกเข้าใช้งาน Nemotron 3 Super ได้แล้วผ่านช่องทางต่างๆ ทั้งบน Hugging Face และ NVIDIA NIM รวมถึงเปิดข้อมูลชุดฝึกฝนให้ดาวน์โหลดไปปรับแต่งเองได้อย่างอิสระ เพื่อส่งเสริมการสร้างระบบเอไอที่ฉลาดและปลอดภัยในระดับองค์กร
ที่มา: NVIDIA Developer Blog
Leave a Reply