Evaluasi Model Amazon Bedrock sekarang mendukung evaluasi model khusus

Dikirim di: 9 Okt 2024

Evaluasi Model di Amazon Bedrock memungkinkan Anda mengevaluasi, membandingkan, dan memilih model dasar terbaik untuk kasus penggunaan Anda. Amazon Bedrock menawarkan pilihan evaluasi otomatis dan evaluasi manusia. Anda dapat menggunakan evaluasi otomatis dengan algoritma untuk metrik yang telah ditentukan sebelumnya seperti akurasi, ketahanan, dan toksisitas. Selain itu, untuk metrik atau metrik subjektif dan kustom tersebut, seperti keramahan, gaya, dan keselarasan dengan suara merek, Anda dapat mengatur alur kerja evaluasi manusia dengan beberapa klik. Alur kerja evaluasi manusia dapat memanfaatkan karyawan Anda sendiri atau tim yang dikelola AWS sebagai peninjau. Evaluasi model menyediakan set data bawaan yang dikurasi atau Anda dapat membawa set data Anda sendiri.

Sekarang, pelanggan dapat mengevaluasi model penyetelan khusus mereka sendiri dari penyempurnaan dan pekerjaan pra-pelatihan lanjutan di Amazon Bedrock. Hal ini memungkinkan pelanggan untuk menyelesaikan siklus memilih model dasar, menyesuaikannya, mengevaluasinya, dan menyesuaikannya lagi jika diperlukan atau melanjutkan produksi jika mereka puas dengan hasil evaluasinya. Untuk mengevaluasi model khusus, cukup pilih model kustom dari daftar model untuk dievaluasi dalam alat pemilih model saat membuat pekerjaan evaluasi.

Evaluasi Model di Amazon Bedrock sekarang Tersedia Secara Umum di region komersial ini dan Region AWS GovCloud (AS-Barat).

Untuk mempelajari selengkapnya tentang Evaluasi Model di Amazon Bedrock, lihat halaman web pengalaman pengembang Amazon Bedrock. Untuk memulai, masuk ke Amazon Bedrock di Konsol Manajemen AWS atau gunakan API Amazon Bedrock.