การประเมินโมเดลของ Amazon Bedrock พร้อมให้ใช้งานแล้วในยุโรป (ซูริก)

โพสต์บน: 9 ธ.ค. 2024

การประเมินโมเดลบน Amazon Bedrock ช่วยให้คุณสามารถประเมิน เปรียบเทียบ และเลือกรูปแบบพื้นฐานที่ดีที่สุดสำหรับกรณีการใช้งานของคุณได้ Amazon Bedrock เสนอทางเลือกในการใช้วิธี LLM-as-a-judge (การประเมินด้วยภาษาธรรมชาติ), การประเมินโดยใช้โปรแกรม และการประเมินด้วยมนุษย์ คุณสามารถใช้ LLM-as-a-judge เพื่อดูตัวชี้วัดต่าง ๆ เช่น ความถูกต้อง ความสมบูรณ์ และความสอดคล้อง รวมถึงตัวชี้วัดของ AI ที่มีความรับผิดชอบ เช่น การปฏิเสธคำตอบและอันตรายในคำตอบ การประเมินโดยใช้โปรแกรมมีอัลกอริทึมสำหรับตัวชี้วัดต่าง ๆ เช่น ความแม่นยำ ความทนทาน และความไม่เหมาะสม นอกจากนี้ สำหรับตัวชี้วัดดังกล่าวหรือตัวชี้วัดที่มีความเป็นปัจเจกและกำหนดได้เอง เช่น ความเป็นมิตรหรือสไตล์ คุณสามารถตั้งค่าขั้นตอนการประเมินด้วยมนุษย์ได้ในไม่กี่คลิก การประเมินด้วยมนุษย์นั้นจะมาจากพนักงานของคุณหรือทีมที่จัดการโดย AWS โดยทำหน้าที่เป็นผู้ตรวจสอบ การประเมินโมเดลมีชุดข้อมูลที่คัดสรรในตัวหรือคุณสามารถนำชุดข้อมูลของคุณเองมาได้ ในปัจจุบัน ลูกค้าสามารถประเมินโมเดลในยุโรป (ซูริก) ได้แล้ว

การประเมินโมเดลบน Amazon Bedrock พร้อมให้ใช้งานแล้วในรีเจี้ยนเหล่านี้ และประเภทการประเมินที่พร้อมให้ใช้งานจะแตกต่างกันไปในแต่ละรีเจี้ยน

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการประเมินโมเดลบน Amazon Bedrock โปรดดูหน้าการประเมินของ Amazon Bedrock หากต้องการเริ่มต้นใช้งาน ให้ลงชื่อเข้าใช้ Amazon Bedrock ในคอนโซลการจัดการของ AWS หรือใช้ Amazon Bedrock API