Evaluasi Model Dasar Amazon sekarang tersedia di AWS Region GovCloud (AS-Barat)
Evaluasi Model di Amazon Bedrock memungkinkan Anda mengevaluasi, membandingkan, dan memilih model dasar terbaik untuk kasus penggunaan Anda. Amazon Bedrock menawarkan pilihan evaluasi otomatis dan evaluasi manusia. Anda dapat menggunakan evaluasi otomatis dengan algoritma untuk metrik yang telah ditentukan sebelumnya seperti akurasi, ketahanan, dan toksisitas. Evaluasi model menyediakan set data bawaan yang dikurasi atau Anda dapat membawa set data Anda sendiri.
Antarmuka interaktif Amazon Bedrock memandu Anda melalui evaluasi model. Anda cukup memilih evaluasi otomatis, memilih jenis tugas dan metrik, dan mengunggah set data prompt Anda. Amazon Bedrock kemudian menjalankan evaluasi dan menghasilkan laporan, sehingga Anda dapat dengan mudah memahami kinerja model terhadap metrik yang Anda pilih, dan memilih yang tepat untuk kasus penggunaan Anda. Menggunakan laporan ini bersama dengan metrik biaya dan latensi dari Amazon Bedrock, Anda dapat memilih model dengan pertukaran kualitas, biaya, dan latensi yang diperlukan.
Evaluasi Model di Amazon Bedrock sekarang Umumnya Tersedia di AWS GovCloud (AS-Barat) selain di banyak region komersial.
Untuk mempelajari selengkapnya tentang Evaluasi Model di Amazon Bedrock, lihat halaman web pengalaman pengembang Amazon Bedrock. Untuk memulai, masuk ke Amazon Bedrock di Konsol Manajemen AWS atau gunakan API Amazon Bedrock.