Model Claude 3.5 Sonnet yang ditingkatkan Anthropic dan penggunaan komputer sekarang di Amazon Bedrock

Dikirim di: 22 Okt 2024

Model Claude 3.5 Sonnet yang ditingkatkan Anthropic sekarang tersedia di Amazon Bedrock. Menurut Anthropic, model ini memberikan peningkatan menyeluruh dibandingkan pendahulunya, dengan keuntungan signifikan dalam pengodean—area di mana ia sudah memimpin lapangan.

Model Claude 3.5 Sonnet yang ditingkatkan menunjukkan peningkatan luas pada tolok ukur industri. Pada pengodean, model meningkatkan kinerja di SWE-Bench Verified dari 33% menjadi 49%, skor lebih tinggi daripada semua model yang tersedia untuk umum, menurut Anthropic. Ini juga meningkatkan kinerja pada TAU-bench, tugas penggunaan alat agen, dari 62,6% menjadi 69,2% di domain ritel, dan dari 36,0% menjadi 46,0% di domain maskapai. Claude 3.5 Sonnet baru menawarkan kemajuan ini dengan harga yang sama dengan pendahulunya. Selain itu, Claude 3.5 Sonnet sekarang menawarkan kemampuan penggunaan komputer di Amazon Bedrock dalam beta publik, memungkinkan Claude untuk melihat dan berinteraksi dengan antarmuka komputer. Pengembang dapat mengarahkan Claude untuk menggunakan komputer seperti yang dilakukan orang—dengan melihat layar, menggerakkan kursor, mengklik tombol, dan mengetik teks. Mengingat teknologi ini masih awal, pengembang didorong untuk mengeksplorasi tugas-tugas berisiko rendah.

Model Claude 3.5 Sonnet yang ditingkatkan sekarang tersedia di Amazon Bedrock di Wilayah AS Barat (Oregon). Penggunaan komputer sekarang tersedia dalam versi beta publik. Untuk mempelajari selengkapnya, baca blog peluncuran AWS News, halaman produk Claude di Amazon Bedrock, dan dokumentasi. Untuk memulai dengan Claude, kunjungi konsol Amazon Bedrock.