เลือกค่ากำหนดคุกกี้ของคุณ

เราใช้คุกกี้ที่จำเป็นและเครื่องมือที่คล้ายคลึงกันซึ่งจำเป็นในการให้บริการเว็บไซต์และบริการต่างๆ ของเรา เราใช้คุกกี้ประสิทธิภาพเพื่อรวบรวมสถิติที่ไม่ระบุชื่อ เพื่อให้เราเข้าใจว่าลูกค้าใช้เว็บไซต์ของเราอย่างไร และทำการปรับปรุง คุณไม่สามารถปิดใช้งานคุกกี้ที่จำเป็นได้ แต่คุณสามารถคลิก “ปรับแต่ง” หรือ “ปฏิเสธ” เพื่อปฏิเสธคุกกี้ประสิทธิภาพ

หากคุณยอมรับ AWS และบุคคลที่สามที่ได้รับการอนุมัติจะใช้คุกกี้เพื่อมอบคุณสมบัติของเว็บไซต์ที่มีประโยชน์ จดจำการตั้งค่าของคุณ และแสดงเนื้อหาที่เกี่ยวข้อง รวมถึงการโฆษณาที่เกี่ยวข้อง หากต้องการยอมรับหรือปฏิเสธคุ้กกี้ที่ไมจำเป็นทั้งหมด คลิก “ยอมรับ” หรือ “ปฏิเสธ” หากต้องการตัดสินใจโดยละเอียด โปรดคลิก “ปรับแต่ง”

AWS Neuron รองรับ Trainium2 และ NxD Inference แล้ว

โพสต์บน: 23 ธ.ค. 2024

วันนี้ AWS ได้ประกาศเปิดตัว Neuron 2.21 ซึ่งแนะนำการรองรับชิป AWS Trainium2 และอินสแตนซ์ Amazon EC2 Trn2 รวมถึงอินสแตนซ์ประเภท trn2.48xlarge และ Trn2 UltraServer อีกทั้ง ยังเพิ่มการรองรับ PyTorch 2.5 และเปิดตัว NxD Inference และ Neuron Profiler 2.0 (เบต้า) ด้วย NxD Inference คือไลบรารีใหม่ที่ใช้ PyTorch ซึ่งผสานระบบเข้ากับ vLLM ทำให้ปรับใช้โมเดลภาษาขนาดใหญ่และโมเดลหลายรูปแบบได้ง่ายขึ้น และเริ่มต้นใช้งานโมเดล PyTorch ได้ด้วยการเปลี่ยนแปลงโค้ดเพียงเล็กน้อย ส่วน Neuron Profiler 2.0 (เบต้า) คือ Profiler ใหม่ที่เพิ่มขีดความสามารถและการใช้งาน รวมถึงรองรับเวิร์กโหลดแบบกระจายตัว

Neuron 2.21 ยังรองรับการอนุมานโมเดล Llama 3.1 405B โดยใช้ NxD Inference บนอินสแตนซ์ trn2.48xlarge ตัวเดียว การเปิดตัวนี้มีการอัปเดต Deep Learning Containers (DLC) และ Deep Learning AMI (DLAMI) และเพิ่มการรองรับสถาปัตยกรรมโมเดลต่าง ๆ รวมถึงโมเดล Llama 3.2, Llama 3.3 และ Mixture-of-Experts (MoE) ฟีเจอร์การอนุมานใหม่ ๆ ได้แก่ การแปลงขนาดน้ำหนักแบบ FP8 และการถอดรหัสแบบแฟลชสำหรับการถอดรหัสแบบคาดเดาใน Transformers NeuronX (TNx) นอกจากนี้ ยังมีการเพิ่มตัวอย่างและฟีเจอร์การฝึกใหม่ ๆ เช่น การรองรับ HuggingFace Llama 3/3.1 70B บนอินสแตนซ์ Trn2 และการรองรับ DPO สำหรับการจัดแนวโมเดลหลังการฝึก

AWS Neuron SDK รองรับการฝึกและใช้งานโมเดลบนอินสแตนซ์ Trn1, Trn2 และ Inf2 ซึ่งมีให้บริการใน AWS Region ในรูปแบบ On-Demand Instance, Reserved Instance, Spot Instance หรือเป็นส่วนหนึ่งของ Savings Plan

สำหรับรายการฟีเจอร์ใหม่และการปรับปรุงทั้งหมดใน Neuron 2.21 และเพื่อเริ่มต้นใช้งาน Neuron โปรดดู:

เลือกค่ากำหนดคุกกี้ของคุณ

AWS Neuron รองรับ Trainium2 และ NxD Inference แล้ว

สิ้นสุดการรองรับ Internet Explorer