Evaluasi Model Amazon Bedrock sekarang tersedia di Eropa (Zürich)

Dikirim di: 9 Des 2024

Evaluasi Model di Amazon Bedrock memungkinkan Anda mengevaluasi, membandingkan, dan memilih model dasar terbaik untuk kasus penggunaan Anda. Amazon Bedrock menawarkan pilihan untuk menggunakan LLM-as-a-Judge, evaluasi terprogram, dan evaluasi manusia. Anda dapat menggunakan LLM-as-a-Judge untuk metrik seperti kebenaran, kelengkapan, dan koherensi, serta metrik AI yang bertanggung jawab seperti penolakan jawaban dan bahaya. Evaluasi terprogram menawarkan algoritma untuk metrik seperti akurasi, ketahanan, dan toksisitas. Selain itu, untuk metrik subjektif dan khusus tersebut, seperti keramahan atau gaya, Anda dapat menyiapkan alur kerja evaluasi manusia dengan beberapa klik. Evaluasi manusia memanfaatkan karyawan Anda sendiri atau tim yang dikelola AWS sebagai peninjau. Evaluasi model menyediakan set data bawaan yang dikurasi atau Anda dapat membawa set data Anda sendiri. Sekarang, pelanggan dapat mengevaluasi model di Eropa (Zürich).

Evaluasi Model di Amazon Bedrock sekarang tersedia di region ini, dan ketersediaan jenis evaluasi bervariasi menurut region.

Untuk mempelajari lebih lanjut tentang Evaluasi Model di Amazon Bedrock, lihat halaman Evaluasi Amazon Bedrock. Untuk memulai, masuk ke Amazon Bedrock di Konsol Manajemen AWS atau gunakan API Amazon Bedrock.