Amazon SageMaker เปิดตัวการอนุมานแบบหลายอะแดปเตอร์แล้ว
ในวันนี้ Amazon SageMaker ปิดตัวความสามารถในการอนุมานแบบหลายอะแดปเตอร์ใหม่ ที่จะปลดล็อกความเป็นไปได้อันน่าตื่นเต้นสำหรับลูกค้าที่ใช้โมเดลภาษาที่ผ่านการฝึกล่วงหน้ามาแล้ว ฟีเจอร์นี้ช่วยให้คุณสามารถปรับใช้อะแดปเตอร์โมเดล LoRA (Low-Rank Adaptation) ที่ปรับแต่งได้หลายร้อยตัวหลังตำแหน่งข้อมูลเดียวได้ โดยโหลดอะแดปเตอร์ที่เหมาะสมแบบไดนามิกในมิลลิวินาทีตามคำขอ วิธีนี้ช่วยให้คุณสามารถโฮสต์อะแดปเตอร์ LoRA เฉพาะจำนวนมากที่สร้างขึ้นบนโมเดลพื้นฐานทั่วไปได้อย่างมีประสิทธิภาพ ส่งมอบอัตราการโอนถ่ายข้อมูลได้สูงและประหยัดค่าใช้จ่ายเมื่อเทียบกับการใช้โมเดลแยกต่างหาก
การอนุมานแบบหลายอะแดปเตอร์ช่วยให้คุณสามารถปรับแต่งโมเดลที่ผ่านการฝึกล่วงหน้าได้อย่างรวดเร็ว เพื่อตอบสนองความต้องการทางธุรกิจที่หลากหลาย ตัวอย่างเช่น บริษัททางการตลาดและ SaaS สามารถปรับแต่งแอปพลิเคชัน AI/ML ได้โดยใช้อิมเมจเฉพาะของลูกค้าแต่ละราย รูปแบบการสื่อสาร และเอกสารประกอบเพื่อสร้างเนื้อหาที่เหมาะสมได้ในไม่กี่วินาที ในทำนองเดียวกัน องค์กรในอุตสาหกรรม เช่น บริการทางการแพทย์และการเงินสามารถนำโมเดลพื้นฐานที่ใช้ LoRA กลับมาใช้ใหม่ เพื่อจัดการกับงานเฉพาะที่หลากหลาย ตั้งแต่การวินิจฉัยทางการแพทย์ไปจนถึงการตรวจจับการฉ้อโกง ง่าย ๆ เพียงแค่สลับเปลี่ยนอะแดปเตอร์ที่ผ่านการปรับแต่งแล้วให้เหมาะสม ความยืดหยุ่นและประสิทธิภาพยังช่วยปลดล็อกโอกาสใหม่ในการใช้ AI ที่ทรงพลังและปรับเปลี่ยนได้ในองค์กรของคุณอีกด้วย
ฟีเจอร์การอนุมานแบบหลายอะแดปเตอร์มีให้บริการโดยทั่วไปในเอเชียแปซิฟิก (โตเกียว โซล มุมไบ สิงคโปร์ ซิดนีย์ จาการ์ตา), แคนาดา (ภาคกลาง), ยุโรป (แฟรงก์เฟิร์ต สตอกโฮล์ม ไอร์แลนด์ ลอนดอน), ตะวันออกกลาง (สหรัฐอาหรับเอมิเรตส์), อเมริกาใต้ (เซาเปาลู), สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ โอไฮโอ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน)
ดูข้อมูลเพิ่มเติมเกี่ยวกับการใช้ LoRa และการจัดการอะแดปเตอร์โมเดลได้ที่คู่มือนักพัฒนา Amazon SageMaker เพื่อเริ่มต้นใช้งาน