Amazon SageMaker AI เปิดตัวคำแนะนำการอนุมาน AI ช่วยสร้างที่ได้รับการปรับให้เหมาะสม
Amazon SageMaker AI รองรับคำแนะนำการอนุมานแล้ว ซึ่งเป็นความสามารถใหม่ที่ไม่ต้องอาศัยการปรับให้เหมาะสมและการเปรียบเทียบเกณฑ์มาตรฐานด้วยตนเอง เพื่อให้ได้ประสิทธิภาพการอนุมานที่ดีที่สุด SageMaker AI ช่วยเร่งเส้นทางสู่การผลิตและช่วยให้นักพัฒนาโมเดลของคุณมุ่งเน้นไปที่การสร้างแบบจำลองที่แม่นยำ ไม่ใช่การจัดการโครงสร้างพื้นฐาน ด้วยการนำเสนอการกำหนดค่าการนำไปใช้จริงที่เหมาะสมและผ่านการตรวจสอบแล้ว พร้อมกับตัวชี้วัดประสิทธิภาพ
ลูกค้านำโมเดล AI ช่วยสร้างของตนมาเอง กำหนดรูปแบบการรับส่งข้อมูลที่คาดไว้ และระบุเป้าหมายประสิทธิภาพ (ปรับให้เหมาะสมกับค่าใช้จ่าย ลดเวลาแฝง หรือเพิ่มอัตราการโอนถ่ายข้อมูลสูงสุด) จากนั้น SageMaker AI จะวิเคราะห์สถาปัตยกรรมของโมเดลและนำการปรับให้เหมาะสมที่สอดคล้องกับเป้าหมายดังกล่าวไปใช้กับหลายประเภทอินสแตนซ์ โดยการเปรียบเทียบเกณฑ์มาตรฐานของแต่ละการกำหนดค่าบนโครงสร้างพื้นฐาน GPU จริงด้วยการใช้ NVIDIA AIPerf เมื่อประเมินประเภทอินสแตนซ์หลายแบบ ลูกค้าสามารถเลือกตัวเลือกที่คุ้มค่าที่สุดสำหรับเวิร์กโหลดของตนได้ ผลลัพธ์คือการกำหนดค่าที่พร้อมสำหรับการนำไปใช้จริง โดยมีตัวชี้วัดที่ได้รับการตรวจสอบแล้ว ซึ่งรวมถึงระยะเวลาที่ใช้จนถึงการรับโทเค็นแรก เวลาแฝงระหว่างโทเค็น เปอร์เซ็นไทล์เวลาแฝงของคำขอ อัตราการโอนถ่ายข้อมูล และการคาดการณ์ค่าใช้จ่าย
ความสามารถนี้พร้อมใช้งานแล้ววันนี้ใน AWS Region 7 แห่ง ได้แก่ สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ), เอเชียแปซิฟิก (โตเกียว), ยุโรป (ไอร์แลนด์), เอเชียแปซิฟิก (สิงคโปร์) และยุโรป (แฟรงก์เฟิร์ต) หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่เอกสารประกอบของ SageMaker AI