Amazon SageMaker เปิดตัวการลดทรัพยากรลงเป็นศูนย์สำหรับการอนุมาน AI เพื่อช่วยให้ลูกค้าประหยัดค่าใช้จ่ายแล้ว

โพสต์บน: 25 พ.ย. 2024

เรามีความยินดีที่จะประกาศเปิดตัวการลดทรัพยากรลงเป็นศูนย์ ซึ่งเป็นความสามารถใหม่ในการอนุมาน Amazon SageMaker ที่ช่วยปรับขนาดตำแหน่งข้อมูลลงเหลือศูนย์อินสแตนซ์ในช่วงที่ไม่ใช้งาน ฟีเจอร์นี้สามารถลดต้นทุนในการเรียกใช้การอนุมานด้วยโมเดล AI ได้ ซึ่งมีประโยชน์อย่างมากต่อแอปพลิเคชันที่มีรูปแบบการรับส่งข้อมูลที่มีความแปรผัน เช่น แชทบอท ระบบควบคุมเนื้อหา และกรณีการใช้งาน AI ช่วยสร้างอื่น ๆ

การลดทรัพยากรลงเป็นศูนย์ช่วยให้ลูกค้าสามารถกำหนดค่าตำแหน่งข้อมูลการอนุมานของ SageMaker เพื่อให้ปรับขนาดอินสแตนซ์ลงเหลือศูนย์โดยอัตโนมัติเมื่อไม่ได้ใช้งาน จากนั้นจะปรับขนาดกลับมาเท่าเดิมทันทีเมื่อการรับส่งข้อมูลกลับมาเป็นปกติ ความสามารถนี้สามารถใช้ได้ในสถานการณ์ที่มีรูปแบบการรับส่งข้อมูลที่คาดเดาได้ ปริมาณการอนุมานแบบไม่สม่ำเสมอ และสภาพแวดล้อมการพัฒนา/ทดสอบ การใช้การลดทรัพยากรลงเป็นศูนย์จะง่ายขึ้นด้วยส่วนประกอบการอนุมานของ SageMaker ลูกค้าสามารถกำหนดค่านโยบายการปรับขนาดอัตโนมัติได้ผ่าน AWS SDK สำหรับ Python (Boto3), SageMaker Python SDK หรือ AWS Command Line Interface (AWS CLI) กระบวนการนี้เกี่ยวข้องกับการตั้งค่าตำแหน่งข้อมูลที่เปิดใช้งานการปรับขนาดอินสแตนซ์ที่มีการจัดการ กำหนดค่านโยบายการปรับขนาด และสร้างสัญญาณเตือน CloudWatch เพื่อกระตุ้นการดำเนินการปรับขนาด

การลดทรัพยากรลงเป็นศูนย์มีให้บริการโดยทั่วไปในทุก AWS Region ที่รองรับ Amazon SageMaker แล้ว โปรดไปที่หน้าเอกสารประกอบของเรา เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับการลดทรัพยากรลงเป็นศูนย์และการปรับต้นทุนสำหรับการนำ AI ช่วยสร้างไปใช้จริง