Amazon Bedrock memperkenalkan tingkat Layanan Cadangan
Hari ini, Amazon Bedrock memperkenalkan tingkat layanan Cadangan baru yang dirancang untuk beban kerja yang membutuhkan kinerja yang dapat diprediksi dan kapasitas token per menit yang dijamin. Tingkat Cadangan menyediakan kemampuan untuk mencadangkan kapasitas komputasi prioritas, menjaga tingkat layanan dapat diprediksi untuk aplikasi penting misi Anda. Ini juga mencakup fleksibilitas untuk mengalokasikan kapasitas token input dan output yang berbeda per menit agar sesuai dengan persyaratan yang tepat dari beban kerja dan biaya kontrol Anda. Ini sangat berharga karena banyak beban kerja memiliki pola penggunaan token asimetris. Misalnya, tugas ringkasan menghabiskan banyak token input tetapi menghasilkan token output lebih sedikit, sementara aplikasi pembuatan konten membutuhkan lebih sedikit input dan lebih banyak kapasitas output. Ketika aplikasi Anda membutuhkan lebih banyak kapasitas token per menit daripada yang Anda pesan, layanan secara otomatis meluap ke tingkat Standar bayar sesuai penggunaan, memastikan operasi tidak terganggu. Tingkat Cadangan menargetkan waktu aktif 99,5% untuk respons model dan tersedia hari ini untuk Anthropic Claude Sonnet 4.5. Pelanggan dapat memesan kapasitas untuk durasi 1 bulan atau 3 bulan. Pelanggan membayar harga tetap per 1K token per menit dan ditagih setiap bulan.
Dengan tingkat layanan Cadangan, Amazon Bedrock terus memberikan lebih banyak pilihan kepada pelanggan, membantu mereka mengembangkan, menskalakan, dan men-deploy aplikasi dan agen yang meningkatkan produktivitas dan pengalaman pelanggan sambil menyeimbangkan kinerja dan persyaratan biaya.
Untuk informasi selengkapnya tentang AWS Region tempat Amazon Bedrock Reserved tersedia, lihat Dokumentasi. Untuk mendapatkan akses ke tingkat Cadangan, hubungi tim akun AWS Anda.