Amazon Bedrock kini mendukung inferensi lintas region

Dikirim di: 27 Agt 2024

Hari ini, Amazon Bedrock mengumumkan dukungan untuk inferensi lintas region, fitur opsional yang memungkinkan pengembang mengelola lonjakan lalu lintas secara lancar dengan memanfaatkan komputasi di berbagai AWS Region. Dengan menggunakan inferensi lintas region, pelanggan Bedrock yang menggunakan mode sesuai permintaan akan dapat memperoleh batas throughput yang lebih tinggi (hingga 2x kuota di region yang dialokasikan) dan ketahanan yang ditingkatkan selama periode permintaan puncak. Dengan ikut serta, pengembang tidak perlu lagi menghabiskan waktu dan tenaga untuk memprediksi fluktuasi permintaan. Sebaliknya, inferensi lintas region secara dinamis merutekan lalu lintas ke beberapa region, memastikan ketersediaan optimal untuk setiap permintaan dan kinerja yang lebih lancar selama periode penggunaan tinggi.

Pelanggan dapat mengontrol ke mana data inferensi mereka mengalir dengan memilih dari serangkaian region yang telah ditentukan sebelumnya, membantu mereka mematuhi persyaratan residensi data dan hukum kedaulatan yang berlaku. Selain itu, kemampuan ini memprioritaskan region sumber API Bedrock yang terhubung jika memungkinkan, membantu meminimalkan latensi dan meningkatkan responsivitas. Hasilnya, pelanggan dapat meningkatkan keandalan, kinerja, dan efisiensi aplikasi mereka.

Tidak ada biaya perutean tambahan untuk menggunakan inferensi lintas region dan Anda akan dikenakan biaya berdasarkan region di mana Anda membuat permintaan (region sumber). Silakan temukan daftar model yang didukung dan region yang telah ditentukan di sini. Untuk mempelajari lebih lanjut tentang fitur dan cara memulai, lihat dokumentasi Amazon Bedrock atau blog ini.