ข้ามไปที่เนื้อหาหลัก

Amazon Bedrock

การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลของ Amazon Bedrock

ภาพรวม

เมื่อใช้การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลของ Amazon Bedrock คุณจึงสามารถใช้โมเดลที่มีขนาดเล็กลง แต่ทำงานได้รวดเร็วและคุ้มค่ายิ่งขึ้น ซึ่งจะให้ความถูกต้องแม่นยำตามกรณีใช้งานและมีประสิทธิภาพทัดเทียมโมเดลขั้นสูงสุดใน Amazon Bedrock โมเดลที่มีขนาดเล็กลงใน Amazon Bedrock นั้นเร็วกว่า 500% และราคาถูกกว่าโมเดลดั้งเดิมถึง 75% โดยมีการสูญเสียความถูกต้องแม่นยำน้อยกว่า 2% สำหรับกรณีการใช้งานอย่าง RAG

ใช้โมเดลขนาดเล็กและคุ้มค่ามากขึ้น

เมื่อใช้การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดล ลูกค้าจึงสามารถเลือกโมเดล “การสอน” ซึ่งต้องการบรรลุความถูกต้องตามกรณีการใช้งาน จากนั้นเลือกโมเดล “การเรียนรู้” ที่ต้องการปรับแต่ง นอกจากนี้ ลูกค้ายังระบุพร้อมท์สำหรับกรณีการใช้งานได้อีกด้วย การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลทำให้กระบวนการสร้างการตอบสนองจากการสอนเป็นไปโดยอัตโนมัติและใช้การตอบสนองเหล่านั้นเพื่อปรับแต่งโมเดลการเรียนรู้อย่างละเอียด จากนั้นโมเดลการเรียนรู้จะทำตามโมเดลการสอนที่มีความถูกต้องแม่นยำเหมือนกันโดยมีต้นทุนที่ลดลง Model Distillation รองรับโมเดลหลากหลายจากผู้ให้บริการโมเดลต่างๆ รวมถึง Amazon Nova Premier (โมเดลขนาดใหญ่) และ Nova Pro (โมเดลขนาดเล็ก), Claude 3.5 Sonnet v2 (โมเดลขนาดใหญ่), Llama 3.3 70B (โมเดลขนาดใหญ่) และ Llama 3.2 1B/3B (โมเดลขนาดเล็ก) สามารถเรียกโมเดลที่กำหนดเองเฉพาะได้ผ่านการอนุมานตามความต้องการ ซึ่งช่วยลดความต้องการโครงสร้างพื้นฐานที่เปิดอยู่เสมอ โปรดดูรายการโมเดล ที่นี่
Screenshot of a user interface for selecting teacher and student models for distillation, featuring Llama 3.1 models. The teacher model Llama 3.1 405B is selected, and student model options include Llama 3.1 70B and Llama 3.1 8B.

เพิ่มประสิทธิภาพของโมเดลที่มีขนาดเล็กลงด้วยการสังเคราะห์ข้อมูลที่เป็นกรรมสิทธิ์เฉพาะ

การปรับแต่งโมเดลขนาดเล็กและประหยัดค่าใช้จ่ายเพื่อให้ได้ความแม่นยำคล้ายกับโมเดลขนาดใหญ่กว่าสำหรับกรณีการใช้งานเฉพาะเป็นกระบวนการทำซ้ำ การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลอาจเลือกใช้วิธีการสังเคราะห์ข้อมูลที่แตกต่างกันที่เหมาะสมที่สุดสำหรับกรณีการใช้งานของคุณเพื่อขจัดภาระของการทำซ้ำที่จำเป็นเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น ตัวอย่างเช่น Bedrock อาจขยายชุดข้อมูลการฝึกโดยสร้างพร้อมท์ที่คล้ายกันหรือสร้างการตอบกลับสังเคราะห์คุณภาพสูงโดยใช้คู่พร้อมท์และการตอบกลับที่ลูกค้าระบุไว้เป็นตัวอย่างชั้นดี
Screenshot of the AWS Synthetic Data Generation and Model Distillation user interface. The UI enables users to set the maximum response length, choose a distillation input dataset from an S3 location or invocation logs, and provides options to upload data or browse S3 buckets to generate synthetic responses for fine-tuning machine learning models.

ลดต้นทุนด้วยการนำข้อมูลจากการใช้งานจริงมาใช้ได้อย่างง่ายดาย

ในการปรับแต่งแบบดั้งเดิม ลูกค้าจะต้องสร้างพร้อมท์และการตอบกลับ เมื่อใช้การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดล ลูกค้าจึงสามารถดำเนินการเพียงระบุพร้อมท์ จากนั้นการถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลจะใช้เพื่อสร้างการตอบสนองแบบสังเคราะห์และปรับแต่งโมเดลการเรียนรู้ ลูกค้าสามารถนำทางเราไปที่ข้อมูลบันทึกการเรียกดำเนินการของลูกค้า และกรองข้อมูลบันทึกตามฟิลด์ข้อมูลเมตาบางอย่างได้ การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลสามารถอ่านทั้งพร้อมท์และการตอบสนองผ่านข้อมูลบันทึกการเรียกดำเนินการ รวมทั้งข้ามการสร้างการตอบสนองที่สังเคราะห์ขึ้นในเวิร์กโฟลว์การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดล ซึ่งจะช่วยลดต้นทุนโดยไม่ต้องสร้างการตอบสนองจากโมเดลการสอนอีกครั้ง เริ่มต้นด้วย ตัวอย่างโค้ด
Screenshot of the AWS Synthetic Data Generation interface showing options for model distillation, including setting response length, selecting distillation input dataset, configuring S3 log access, adding metadata, and managing access to input data such as prompts or prompt-response pairs.

เพิ่มความแม่นยำในการคาดการณ์การเรียกใช้เรียกฟังก์ชันสำหรับเจ้าหน้าที่

การเรียกใช้ฟังก์ชันเจ้าหน้าที่แสดงถึงความสามารถที่สำคัญสำหรับแอปพลิเคชัน AI ที่ทันสมัย ทำให้โมเดลสามารถโต้ตอบกับเครื่องมือภายนอก ฐานข้อมูล และ API โดยกำหนดเวลาที่แม่นยำและวิธีการเรียกดำเนินการฟังก์ชันเฉพาะ แม้ว่าโมเดลขนาดใหญ่มักจะมีความโดดเด่นในการระบุฟังก์ชันที่เหมาะสมในการเรียกใช้และสร้างพารามิเตอร์ที่เหมาะสม แต่โดยทั่วไปแล้วจะมาพร้อมกับต้นทุนและความล่าช้าที่สูงขึ้น Amazon Bedrock Model Distillation ช่วยให้โมเดลขนาดเล็กสามารถคาดการณ์การเรียกใช้ฟังก์ชันได้อย่างแม่นยำ เพื่อเวลาตอบสนองที่เร็วขึ้นอย่างมากและลดต้นทุนการดำเนินงาน