Amazon Bedrock รองรับการประเมิน RAG (พร้อมใช้งานโดยทั่วไป) แล้ว

โพสต์บน: 20 มี.ค. 2025

ขณะนี้ การประเมิน RAG ของ Amazon Bedrock พร้อมให้ใช้งานโดยทั่วไปแล้ว คุณสามารถประเมินแอปพลิเคชันการดึงข้อมูลเพื่อการสร้างแบบเสริม (RAG) ของคุณ ไม่ว่าจะเป็นแอปพลิเคชันที่ต่อยอดมาจากฐานความรู้สำหรับ Amazon Bedrock หรือระบบ RAG ที่กำหนดเอง คุณสามารถประเมินการดึงข้อมูลหรือการสร้างแบบครบวงจรก็ได้ การประเมินขับเคลื่อนด้วย LLM-as-a-Judge โดยมีทางเลือกโมเดลการตัดสินหลายทางเลือก สำหรับการดึงข้อมูล คุณสามารถเลือกจากตัวชี้วัดต่าง ๆ เช่น ความเกี่ยวข้องและความครอบคลุมของบริบท สำหรับการดึงข้อมูลและการสร้างแบบครบวงจร คุณสามารถเลือกจากตัวชี้วัดคุณภาพ เช่น ความถูกต้อง ความสมบูรณ์ และความน่าเชื่อถือ (การตรวจจับผลลัพธ์เพี้ยน) และตัวชี้วัด AI ที่มีความรับผิดชอบ เช่น ความเป็นอันตราย การปฏิเสธคำตอบ และการเหมารวม นอกจากนี้ คุณยังสามารถเปรียบเทียบงานการประเมินเพื่อทำซ้ำบนฐานความรู้หรือแอปพลิเคชัน RAG แบบกำหนดเองที่มีการตั้งค่าแตกต่างกัน เช่น กลยุทธ์การแบ่งข้อมูลหรือความยาวเวกเตอร์ ตัวจัดอันดับใหม่ หรือโมเดลการสร้างเนื้อหาที่แตกต่างกัน

*ใหม่เอี่ยม พร้อมความยืดหยุ่นมากขึ้น!* ณ วันนี้ นอกเหนือจากฐานความรู้สำหรับ Bedrock แล้ว การประเมิน RAG ของ Amazon Bedrock ยังรองรับการประเมินไปป์ไลน์ RAG ที่กำหนดเองอีกด้วย ในตอนนี้ ลูกค้าที่ประเมินไปป์ไลน์ RAG ที่กำหนดเองสามารถนำคู่อินพุต-เอาต์พุตและบริบทที่ดึงมาเข้าไปสู่งานการประเมินได้โดยตรงในชุดข้อมูลอินพุต ทำให้พวกเขาสามารถหลีกเลี่ยงการเรียกใช้ไปที่ฐานความรู้สำหรับ Bedrock (“นำการตอบสนองการอนุมานของคุณเองมาใช้”) นอกจากนี้ เรายังได้เพิ่มตัวชี้วัดความแม่นยำในการอ้างอิงและความครอบคลุมในการอ้างอิงสำหรับการประเมินฐานความรู้สำหรับ Bedrock อีกด้วย หากคุณใช้ฐานความรู้สำหรับ Bedrock เป็นส่วนหนึ่งของการประเมิน คุณสามารถผสานรวม Guardrails สำหรับ Amazon Bedrock ได้โดยตรง

หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่หน้าการประเมินและเอกสารประกอบ Amazon Bedrock หากต้องการเริ่มต้นใช้งาน ให้เข้าสู่ระบบคอนโซลของ Amazon Bedrock หรือใช้ Amazon Bedrock API