OpenAI จับมือ Broadcom พัฒนา Jalapeño ชิปเร่งความเร็วการประมวลผล LLM (โมเดลภาษาขนาดใหญ่) ออกแบบเพื่อใช้ในระบบ Inference (การอนุมานผลของปัญญาประดิษฐ์) โดยเฉพาะ เป้าหมายเพื่อลดความล่าช้า เพิ่มความเสถียร และลดต้นทุนการประมวลผลสำหรับผู้ใช้งาน ChatGPT และ API ของ OpenAI โดยเริ่มติดตั้งในศูนย์ข้อมูลร่วมกับ Microsoft ตั้งแต่ปี 2026 เป็นต้นไป
การออกแบบชิป Jalapeño เน้นการจัดการทรัพยากรหน่วยความจำและระบบเครือข่าย ลดการย้ายข้อมูลที่ไม่จำเป็นภายในสถาปัตยกรรมชิป การทดสอบเบื้องต้นชี้ให้เห็นประสิทธิภาพการใช้พลังงานดีกว่าชิปประมวลผลระดับสูงในท้องตลาดปัจจุบัน Sam Altman CEO ของ OpenAI และ Greg Brockman ประธานบริหาร ได้รับชิปต้นแบบจาก Hock Tan CEO ของ Broadcom เพื่อนำไปทดสอบการรันเวิร์กโหลดจริงภายในห้องปฏิบัติการ
กระบวนการพัฒนา ASIC (ชิปวงจรรวมเฉพาะงาน) รุ่นนี้ใช้เวลาเพียง 9 เดือนนับจากเริ่มออกแบบจนถึงขั้นตอนผลิต OpenAI ใช้ประโยชน์จากโมเดลปัญญาประดิษฐ์ของตนเองเข้ามาช่วยวิเคราะห์และปรับปรุงโครงสร้างของชิป ถือเป็นรอบการพัฒนาที่รวดเร็วที่สุดเท่าที่เคยบันทึกไว้สำหรับชิปเซมิคอนดักเตอร์ประสิทธิภาพสูง การทำงานครั้งนี้ยังได้รับความร่วมมือจาก Celestica ในการผลิตเมนบอร์ดและระบบเซิร์ฟเวอร์แบบแร็ค
โครงสร้างพื้นฐานฮาร์ดแวร์ใหม่นี้ถูกวางแผนให้เป็นแพลตฟอร์มแบบหลายเจเนอเรชัน เพื่อรองรับการขยายตัวของศูนย์ข้อมูลระดับกิกะวัตต์ การพัฒนาฮาร์ดแวร์เองช่วยให้ OpenAI ควบคุมต้นทุนและประสิทธิภาพของระบบประมวลผลได้ดีขึ้น โดยในอนาคตชิป Jalapeño จะถูกนำไปใช้ประมวลผลโมเดลภาษาขนาดใหญ่สำหรับผลิตภัณฑ์กลุ่ม Agentic AI และเครื่องมือพัฒนาซอฟต์แวร์ Codex
ที่มา: OpenAI