Mengumumkan inferensi yang dioptimalkan untuk latensi untuk model dasar Amazon Nova Pro di Amazon Bedrock

Dikirim di: 5 Mar 2025

Model dasar Amazon Nova Pro kini mendukung inferensi yang dioptimalkan untuk latensi dalam pratinjau di Amazon Bedrock, memungkinkan waktu respons yang lebih cepat dan peningkatan responsivitas untuk aplikasi AI generatif. Inferensi yang dioptimalkan dengan latensi mempercepat waktu respons untuk aplikasi yang sensitif terhadap latensi, meningkatkan pengalaman pengguna akhir dan memberi pengembang lebih banyak fleksibilitas untuk mengoptimalkan kinerja untuk kasus penggunaan mereka. Mengakses kemampuan ini tidak memerlukan pengaturan tambahan atau penyempurnaan model, memungkinkan peningkatan langsung pada aplikasi yang ada dengan waktu respons yang lebih cepat.

Inferensi latensi yang dioptimalkan untuk Amazon Nova Pro tersedia melalui inferensi lintas region di region AS Barat (Oregon), AS Timur (Virginia), dan AS Timur (Ohio). Pelajari selengkapnya tentang model dasar Amazon Nova di Blog Berita AWS, halaman produk Amazon Nova, atau panduan pengguna Amazon Nova.. Pelajari lebih lanjut tentang inferensi latensi yang dioptimalkan pada Bedrock dalam dokumentasi. Anda dapat memulai dengan model pondasi Amazon Nova di Amazon Bedrock dari konsol Amazon Bedrock.

Mengumumkan inferensi yang dioptimalkan untuk latensi untuk model dasar Amazon Nova Pro di Amazon Bedrock

Pelajari

Sumber Daya

Developer

Bantuan