การถ่ายโอนเพื่อลดขนาดข้อมูลของ Amazon Bedrock
ภาพรวม
เมื่อใช้การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลของ Amazon Bedrock คุณจึงสามารถใช้โมเดลที่มีขนาดเล็กลง แต่ทำงานได้รวดเร็วและคุ้มค่ายิ่งขึ้น ซึ่งจะให้ความถูกต้องแม่นยำตามกรณีใช้งานและมีประสิทธิภาพทัดเทียมโมเดลขั้นสูงสุดใน Amazon Bedrock โมเดลที่มีขนาดเล็กลงใน Amazon Bedrock นั้นเร็วกว่า 500% และราคาถูกกว่าโมเดลดั้งเดิมถึง 75% โดยมีการสูญเสียความถูกต้องแม่นยำน้อยกว่า 2% สำหรับกรณีการใช้งานอย่าง RAG
ใช้โมเดลขนาดเล็กและคุ้มค่ามากขึ้น
เมื่อใช้การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดล ลูกค้าจึงสามารถเลือกโมเดล “การสอน” ซึ่งต้องการบรรลุความถูกต้องตามกรณีการใช้งาน จากนั้นเลือกโมเดล “การเรียนรู้” ที่ต้องการปรับแต่ง นอกจากนี้ ลูกค้ายังระบุพร้อมท์สำหรับกรณีการใช้งานได้อีกด้วย การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลทำให้กระบวนการสร้างการตอบสนองจากการสอนเป็นไปโดยอัตโนมัติและใช้การตอบสนองเหล่านั้นเพื่อปรับแต่งโมเดลการเรียนรู้อย่างละเอียด จากนั้นโมเดลการเรียนรู้จะทำตามโมเดลการสอนที่มีความถูกต้องแม่นยำเหมือนกันโดยมีต้นทุนที่ลดลง

เพิ่มประสิทธิภาพของโมเดลที่มีขนาดเล็กลงด้วยการสังเคราะห์ข้อมูลที่เป็นกรรมสิทธิ์เฉพาะ
การปรับแต่งโมเดลขนาดเล็กและประหยัดค่าใช้จ่ายเพื่อให้ได้ความแม่นยำคล้ายกับโมเดลขนาดใหญ่กว่าสำหรับกรณีการใช้งานเฉพาะเป็นกระบวนการทำซ้ำ การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลอาจเลือกใช้วิธีการสังเคราะห์ข้อมูลที่แตกต่างกันที่เหมาะสมที่สุดสำหรับกรณีการใช้งานของคุณเพื่อขจัดภาระของการทำซ้ำที่จำเป็นเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น ตัวอย่างเช่น Bedrock อาจขยายชุดข้อมูลการฝึกโดยสร้างพร้อมท์ที่คล้ายกันหรือสร้างการตอบกลับสังเคราะห์คุณภาพสูงโดยใช้คู่พร้อมท์และการตอบกลับที่ลูกค้าระบุไว้เป็นตัวอย่างชั้นดี

ลดต้นทุนด้วยการนำข้อมูลจากการใช้งานจริงของคุณมาใช้ได้อย่างง่ายดาย
ในการปรับแต่งแบบดั้งเดิม ลูกค้าจะต้องสร้างพร้อมท์และการตอบสนอง สำหรับ Model Distillation ลูกค้าแค่ระบุพร้อมท์เท่านั้น จากนั้น Model Distillation จะใช้เพื่อสร้างการตอบสนองแบบสังเคราะห์และปรับแต่งโมเดลนักเรียน ลูกค้าสามารถนำทางเราไปที่ข้อมูลบันทึกการเรียกดำเนินการของลูกค้า และกรองข้อมูลบันทึกตามฟิลด์ข้อมูลเมตาบางอย่างได้ Model Distillation สามารถอ่านทั้งพร้อมท์และการตอบสนองผ่านข้อมูลบันทึกการเรียกดำเนินการ รวมทั้งข้ามการสร้างการตอบสนองแบบสังเคราะห์ในเวิร์กโฟลว์ Model Distillation ซึ่งจะช่วยลดต้นทุนโดยไม่ต้องสร้างการตอบสนองจากแบบโมเดลผู้สอนอีกครั้ง เริ่มต้นด้วยตัวอย่างโค้ด
