การประกาศเปิดตัว AWS Neuron SDK 2.25.0
วันนี้ AWS ขอประกาศเปิดตัวความพร้อมใช้งานทั่วไปของ Neuron SDK 2.25.0 ที่นำเสนอการปรับปรุงสำหรับเวิร์กโหลดการอนุมานและการติดตามตรวจสอบประสิทธิภาพบนอินสแตนซ์ AWS Inferentia และ Trainium รุ่นล่าสุดนี้เพิ่มการรองรับความสอดคล้องของบริบทและความสอดคล้องของข้อมูล รวมถึง การให้ความสนใจแบบแบ่งส่วน สำหรับการประมวลผลลำดับแบบยาวในการอนุมาน และอัปเดต API Neuron-ls และ Neuron-Monitor ด้วยข้อมูลเพิ่มเติมเกี่ยวกับความเกี่ยวข้องของโหนดและการใช้งานอุปกรณ์ตามลำดับ
รุ่นนี้ยังแนะนำการสร้างนามแฝงอัตโนมัติ (เวอร์ชันเบต้า) สำหรับการดำเนินการของ Tensor ที่รวดเร็ว และเพิ่มการปรับปรุงสำหรับการให้บริการแบบแยกส่วน (เวอร์ชันเบต้า) สุดท้ายนี้ ยังมี AMI ที่ได้รับการอัปเกรด และคอนเทนเนอร์ดีปเลิร์นนิงสำหรับเวิร์กโหลดการอนุมานและเวิร์กโหลดการฝึกบน Neuron
Neuron 2.25.0 พร้อมใช้งานในทุก AWS Region ที่มีอินสแตนซ์ Inferentia และ Trainium
ดูรายละเอียดเพิ่มเติมและรายการฟีเจอร์ใหม่กับการปรับปรุงทั้งหมดได้ที่: