- AWS›
- Amazon Bedrock›
- Harga
Harga Amazon Bedrock
Gambaran umum harga
Amazon Bedrock adalah platform komprehensif untuk membangun aplikasi dan agen AI generatif dengan akses ke model fondasi terkemuka, layanan untuk melakukan deployment dan mengoperasikan agen, serta alat untuk menyesuaikan, melindungi, dan mengoptimalkan aplikasi.
Amazon Bedrock menawarkan opsi harga yang fleksibel untuk inferensi model guna mengoptimalkan biaya sekaligus menyeimbangkan kecepatan, skala, dan kebutuhan akses model. Ini mencakup harga sesuai permintaan untuk penggunaan bayar sesuai pemakaian tanpa komitmen di muka, serta mode batch untuk pemrosesan volume input besar yang hemat biaya. AgentCore menawarkan harga fleksibel berbasis konsumsi tanpa komitmen di muka atau biaya minimum, yang dapat Anda pelajari dengan mengakses halaman harga AgentCore.
Tingkat layanan dan impor model
Tingkat Standar menyediakan performa yang konsisten dengan tarif reguler untuk tugas AI sehari-hari. Dengan tingkat Standar, Anda hanya membayar sesuai penggunaan, tanpa komitmen jangka waktu berbasis waktu. Untuk model pembuatan teks, Anda dikenai biaya untuk setiap token input yang diproses dan setiap token output yang dihasilkan. Untuk model penyematan, Anda dikenai biaya untuk setiap token input yang diproses. Token terdiri dari beberapa karakter dan mengacu pada unit dasar teks yang dipelajari model untuk memahami input dan perintah pengguna. Untuk model pembuatan gambar, Anda dikenai biaya untuk setiap gambar yang dihasilkan.
Tingkat Prioritas adalah tingkat layanan premium yang menyediakan alokasi komputasi prioritas untuk aplikasi yang bersifat misi-kritis. Tingkat layanan ini dihargai dengan tarif premium dibandingkan tingkat Standar. Untuk sebagian besar model yang mendukung tingkat Prioritas, pelanggan dapat memperoleh hingga 25% peningkatan token output per detik (OTPS) dan latensi yang lebih rendah dibandingkan tingkat Standar.
Tingkat Flex menawarkan harga standar dengan diskon untuk beban kerja yang dapat menukar pemrosesan segera demi efisiensi biaya. Cocok untuk beban kerja AI yang tidak mendesak.
Dengan mode Batch, Anda dapat menyediakan sekumpulan prompt sebagai satu file input dan menerima respons sebagai satu file output, sehingga memungkinkan Anda memperoleh prediksi berskala besar secara simultan. Tanggapan diproses dan disimpan di bucket Amazon S3 sehingga Anda dapat mengaksesnya pada lain waktu. Amazon Bedrock menawarkan model fondasi (FM) pilihan dari penyedia AI terkemuka, seperti Anthropic, Meta, Mistral AI, dan Amazon untuk inferensi batch dengan harga hingga 50% lebih rendah dibandingkan dengan harga inferensi sesuai permintaan. Lihat daftar model di sini.
Impor Model Kustom memungkinkan Anda memanfaatkan investasi kustomisasi model sebelumnya di Amazon Bedrock dan menggunakannya dengan cara terkelola sepenuhnya yang sama seperti model dasar ter-hosting milik Bedrock. Anda dapat mengimpor bobot kustom untuk arsitektur model yang didukung dan menyajikan model kustom tersebut menggunakan mode Sesuai Permintaan. Tidak ada biaya untuk mengimpor model kustom ke Bedrock. Setelah mengimpor model, Anda akan dapat mengaksesnya sesuai permintaan tanpa perlu melakukan tindakan bidang kontrol apa pun. Anda hanya dikenai biaya untuk inferensi model, berdasarkan jumlah salinan model kustom yang diperlukan untuk melayani volume inferensi Anda dan durasi setiap salinan model aktif, ditagih dalam periode 5 menit. Salinan model adalah instans tunggal dari model yang diimpor yang siap melayani permintaan inferensi. Harga per salinan model per menit bergantung pada faktor, seperti arsitektur, panjang konteks, AWS Region, versi unit komputasi (pembuatan perangkat keras), dan berjenjang berdasarkan ukuran salinan model.
Kustomisasi dan optimisasi
Penyempurnaan dengan Penguatan
Dengan kapabilitas Penyempurnaan dengan Penguatan di Amazon Bedrock, Anda dapat meningkatkan akurasi model tanpa memerlukan keahlian machine learning mendalam atau kumpulan data berlabel dalam jumlah besar. Amazon Bedrock mengotomatiskan alur kerja penyempurnaan dengan penguatan. Layanan ini mengambil sampel prompt Anda, menghasilkan respons model, dan menilainya menggunakan fungsi hadiah Anda. Prompt, respons, dan skor tersebut kemudian digunakan untuk melatih model kustom Anda melalui alur kerja RFT yang bersifat iteratif. Seluruh alur kerja dikenakan biaya dengan tarif per jam. Anda dapat menyiapkan inferensi pada model kustom dengan membuat deployment sesuai permintaan model kustom. Opsi inferensi sesuai permintaan mencakup model penetapan harga berbasis token yang mengenakan biaya berdasarkan jumlah token yang diproses selama inferensi.
Penyempurnaan Terawasi
Dengan Penyempurnaan Terawasi di Amazon Bedrock, Anda dapat menyesuaikan FM menggunakan data Anda untuk menghasilkan respons yang disesuaikan bagi tugas tertentu dan konteks bisnis Anda. Anda dapat menyempurnakan model menggunakan data berlabel. Untuk kustomisasi model pembuatan teks, Anda dikenai biaya untuk pelatihan model berdasarkan total jumlah token yang diproses oleh model (jumlah token dalam korpus data pelatihan × jumlah epoch), serta biaya penyimpanan model yang dikenakan per bulan per model. Satu epoch mengacu pada satu kali proses penuh melalui set data pelatihan Anda selama penyempurnaan atau prapelatihan lanjutan.
Distilasi Model
Dengan Distilasi Model Amazon Bedrock, Anda dapat mentransfer pengetahuan dari model yang lebih besar dan lebih kapabel (dikenal sebagai “model pengajar”) ke model yang lebih kecil, lebih cepat, dan lebih hemat biaya (dikenal sebagai “model pelajar”), sehingga model pelajar dapat menjadi hampir sama beperforma dengan model pengajar untuk kasus penggunaan tertentu. Dengan Distilasi Model Amazon Bedrock, Anda membayar sesuai dengan apa yang Anda gunakan. Distilasi adalah proses dua langkah dengan data sintetis pertama dihasilkan dari model pengajar lalu model pelajar dilatih. Pembuatan data sintetis dikenai biaya berdasarkan harga sesuai permintaan dari model pengajar yang dipilih. Penyempurnaan model pelajar dikenai biaya berdasarkan tarif kustomisasi model (penyempurnaan terawasi).
Untuk Penyempurnaan Terawasi dan Distilasi Model, Anda dapat menyiapkan inferensi pada model kustom dengan membuat deployment sesuai permintaan model kustom atau membeli Throughput yang Disediakan, tergantung kebutuhan beban kerja dan tujuan biaya spesifik Anda. Opsi inferensi sesuai permintaan mencakup model penetapan harga berbasis token yang mengenakan biaya berdasarkan jumlah token yang diproses selama inferensi. Jika Anda membeli Throughput yang Disediakan, satu unit model disediakan tanpa ketentuan komitmen untuk inferensi pada model yang disesuaikan. Anda akan dikenai biaya untuk jumlah jam unit model pertama yang Anda gunakan untuk inferensi model kustom. Jika Anda ingin meningkatkan throughput melebihi satu unit model, Anda harus membeli ketentuan komitmen 1 bulan atau 6 bulan.
Dengan caching prompt di Amazon Bedrock, Anda dapat melakukan cache konteks berulang di seluruh panggilan API untuk mengurangi biaya dan latensi respons Anda. Prompt sering kali berisi konteks atau awalan umum seperti percakapan panjang dengan banyak giliran, contoh dengan banyak bidikan, serta instruksi terperinci yang menyempurnakan perilaku model. Dengan menggunakan API Amazon Bedrock yang ada, Anda dapat menentukan awalan prompt yang akan Anda cache selama lima menit dalam cache untuk akun AWS tertentu. Selama waktu tersebut, setiap permintaan dengan awalan yang cocok menerima diskon hingga 90% untuk token yang disimpan dan peningkatan latensi hingga 85%. Harga dan peningkatan performa bervariasi menurut model dan panjang prompt, tetapi cache selalu diisolasi ke akun AWS Anda.
Manajemen Prompt Amazon Bedrock mempercepat pembuatan, pengujian, serta menjalankan prompt melalui UI intuitif dan rangkaian API. Anda dapat dengan mudah menguji dan membuat versi prompt Anda, membandingkan varian yang berbeda, serta menjalankannya di infrastruktur nirserver yang aman.
Optimisasi Prompt di Amazon Bedrock secara otomatis menulis ulang prompt untuk performa yang lebih baik dan respons yang lebih ringkas untuk model fondasi. Optimisasi ini terintegrasi dengan Manajemen Prompt untuk perbandingan langsung antara versi asli dan versi yang dioptimalkan, serta pengelolaan siklus hidup prompt. Anda juga dapat menggunakan Optimisasi Prompt di Playground Bedrock, atau secara langsung melalui API.
Alat
Pagar Pembatas Amazon Bedrock adalah satu-satunya kemampuan AI yang bertanggung jawab dari penyedia cloud besar yang membantu Anda membangun dan menyesuaikan perlindungan keamanan, privasi, dan kebenaran untuk aplikasi AI generatif Anda. Hal ini mengevaluasi input pengguna dan respons model berdasarkan kebijakan khusus kasus penggunaan, memberikan lapisan perlindungan tambahan di luar yang tersedia secara native. Perlindungan dari Pagar Pembatas dapat diterapkan pada model yang di-host di Amazon Bedrock atau dengan model pihak ketiga (seperti OpenAI dan Google Gemini) melalui API ApplyGuardrail. Anda juga dapat menggunakan Pagar Pembatas dengan kerangka kerja agen seperti Strands Agents, termasuk agen yang di-deploy menggunakan Amazon Bedrock AgentCore. Pagar Pembatas membantu menyaring halusinasi dan meningkatkan akurasi faktual melalui pemeriksaan landasan kontekstual terhadap konten RAG serta pemeriksaan Penalaran Otomatis untuk memberikan respons yang terbukti benar.
Basis Pengetahuan Amazon Bedrock adalah alur kerja Retrieval-Augmented Generation (RAG) terkelola penuh yang memungkinkan pelanggan untuk membuat aplikasi AI generatif yang sangat akurat, berlatensi rendah, aman, dan kustom dengan memasukkan informasi kontekstual dari sumber data mereka sendiri. Basis Pengetahuan ini mendukung berbagai sumber data, termasuk S3, Confluence, Salesforce, dan SharePoint, dalam pratinjau. Basis Pengetahuan ini juga menawarkan penyerapan dokumen untuk streaming data. Basis Pengetahuan Bedrock mengonversi data tidak terstruktur menjadi sematan, menyimpannya dalam basis data vektor, dan memungkinkan pengambilan dari beragam penyimpanan data. Layanan ini juga terintegrasi dengan Kendra untuk pengambilan terkelola serta mendukung pengambilan data terstruktur menggunakan bahasa alami ke SQL.
Otomatisasi Data Amazon Bedrock mentransformasi konten multimodal yang tidak terstruktur menjadi format data terstruktur untuk kasus penggunaan, seperti pemrosesan dokumen cerdas, analisis video, dan RAG. Otomatisasi Data Bedrock dapat menghasilkan konten Output Standar dengan menggunakan default yang telah ditentukan yang spesifik untuk modalitas tertentu, seperti deskripsi video adegan demi adegan, transkrip audio, atau analisis dokumen otomatis. Pelanggan juga dapat membuat Output Kustom dengan menentukan persyaratan output mereka di Cetak biru berdasarkan skema data mereka sendiri yang kemudian dapat dengan mudah dimuat ke basis data atau gudang data yang ada. Melalui integrasi dengan Basis Pengetahuan, Otomatisasi Data Bedrock juga dapat digunakan untuk menguraikan konten untuk aplikasi RAG, meningkatkan akurasi dan relevansi hasil dengan memasukkan informasi yang disematkan baik dalam gambar maupun teks.
Alur Amazon Bedrock adalah fitur penulisan dan eksekusi alur kerja di Bedrock untuk aplikasi AI generatif. Fitur ini mempercepat pembuatan, pengujian, dan deployment alur kerja AI generatif yang ditentukan pengguna melalui builder visual yang intuitif dan serangkaian API. Alur Amazon Bedrock memungkinkan Anda menghubungkan model fondasi terbaru, Prompt, Agen, Basis Pengetahuan, Pagar Pembatas, dan layanan AWS (seperti Amazon Lex, AWS Lambda, Amazon S3) beserta logika bisnis dengan lancar untuk membangun alur kerja AI generatif. Anda dapat dengan mudah menguji dan membuat versi alur kerja Anda, dan menjalankannya di lingkungan nirserver yang aman melalui antarmuka visual atau API tanpa harus membangun infrastruktur Anda sendiri.
Evaluasi Model: Dengan evaluasi model Amazon Bedrock, Anda membayar sesuai dengan apa yang Anda gunakan, tanpa komitmen volume minimum pada jumlah prompt atau respons. Untuk evaluasi otomatis (terprogram), Anda hanya membayar inferensi dari model pilihan Anda dalam evaluasi. Skor algoritmik yang dihasilkan secara otomatis disediakan tanpa biaya tambahan. Untuk evaluasi otomatis (Model/LLM sebagai juri), Anda hanya membayar inferensi dari model generator dan model evaluator pilihan Anda. Dalam tugas evaluasi model LLM sebagai juri, metrik bawaan menggunakan templat prompt penilaian sistem yang unik untuk setiap metrik dan model penilaian yang tersedia, yang akan ditagih sebagai bagian dari penggunaan token Anda, dan prompt penilaian tersedia di dokumentasi AWS publik sebagai bentuk transparansi. Untuk evaluasi berbasis manusia di mana Anda membawa tim kerja Anda sendiri, Anda dikenakan biaya untuk inferensi model dalam evaluasi, dan biaya 0,21 USD per tugas manusia yang diselesaikan. Tugas manusia didefinisikan sebagai kejadian ketika pekerja manusia mengirimkan evaluasi atas satu perintah dan respons inferensi terkait di antarmuka pengguna evaluasi manusia. Harga per tugas adalah sama baik Anda memiliki satu atau dua model dalam tugas evaluasi Anda dan juga sama terlepas dari berapa banyak metrik evaluasi dan metode penilaian yang Anda sertakan. Biaya untuk tugas manusia akan muncul di bagian Amazon SageMaker di tagihan AWS Anda dan sama untuk semua AWS Region. Tidak ada biaya terpisah untuk tenaga kerja, karena tenaga kerja tersebut disediakan oleh Anda. Jika Anda menggunakan fitur “bawa respons inferensi Anda sendiri” alih-alih memanggil model Bedrock selama tugas evaluasi, Anda hanya dikenakan biaya untuk inferensi model evaluator (pekerjaan LLM sebagai juri) atau 0,21 USD per tugas manusia yang diselesaikan (pekerjaan evaluasi berbasis manusia). Untuk evaluasi yang dikelola oleh AWS, harga disesuaikan dengan kebutuhan evaluasi Anda dalam keterlibatan privat saat bekerja bersama tim evaluasi ahli AWS.
Evaluasi RAG: Dengan evaluasi RAG Amazon Bedrock, Anda membayar sesuai dengan apa yang Anda gunakan, tanpa komitmen volume minimum pada jumlah prompt atau respons. Jika Anda mengevaluasi Basis Pengetahuan Amazon Bedrock, Anda hanya membayar inferensi dari pilihan model generator dan model evaluator Anda (tugas evaluasi menggunakan LLM sebagai juri), serta biaya apa pun yang timbul dari penggunaan Basis Pengetahuan Bedrock dalam tugas evaluasi sesuai dengan harga Basis Pengetahuan Bedrock Amazon Bedrock. Jika menggunakan fitur “bawa respons inferensi Anda sendiri”, Anda hanya dikenai biaya untuk inferensi model evaluator. Dalam tugas evaluasi RAG, metrik bawaan menggunakan templat prompt juri sistem yang unik untuk setiap metrik dan model juri yang tersedia; biayanya akan dihitung sebagai bagian dari penggunaan token Anda. Prompt juri tersebut tersedia dalam dokumentasi AWS publik untuk transparansi. Beberapa metrik melibatkan pelaksanaan inferensi model juri pada konteks yang diambil dari Basis Pengetahuan/sistem RAG Anda atau pada jawaban kebenaran dasar Anda, selain prompt input, yang memengaruhi biaya yang terkait dengan setiap metrik. Informasi selengkapnya tentang setiap metrik dapat ditemukan dalam dokumentasi AWS publik untuk evaluasi.
Detail harga model
Harga bergantung pada modalitas, penyedia, dan model. Pilih penyedia model untuk melihat harga terperinci.
Amazon Bedrock menawarkan model fondasi (FM) terpilih dari penyedia AI terkemuka, seperti Anthropic, Meta, Mistral AI, dan Amazon untuk inferensi batch dengan harga 50% lebih rendah dibandingkan dengan harga inferensi sesuai permintaan. Lihat daftar model di sini.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
DeepSeek
-
Google
-
Kimi AI
-
Luma AI
-
Meta
-
MiniMax AI
-
Mistral AI
-
NVIDIA
-
OpenAI
-
TwelveLabs
-
Stability AI
-
Writer
-
Qwen
-
Impor Model Kustom
-
AI21 Labs
-
AI21 Labs
Harga Sesuai Permintaan
-
Amazon
-
-
Amazon Nova
-
Amazon Titan
-
Amazon Lainnya
-
Amazon Nova
-
Amazon Nova
Harga untuk Model Pemahaman
Inferensi Lintas Wilayah Global
Inferensi lintas wilayah geografis dan dalam wilayah
Alat Bawaan
Harga untuk model Pembuatan Konten Kreatif
Harga untuk Model Pemahaman dan Pembuatan Ucapan
Harga Sesuai Permintaan untuk model fondasi ucapan ke ucapan
Catatan: *Harga input dan output token teks berlaku untuk kasus penggunaan tertentu, seperti transkripsi ucapan-ke-teks, panggilan alat untuk penyelesaian tugas atau landasan pengetahuan, penambahan riwayat percakapan ke sesi, dll.
Inferensi sesuai permintaan untuk model Nova kustom dikenai harga yang sama dengan inferensi Nova dasar.
Harga untuk model Penyematan
-
Amazon Titan
-
Amazon Titan
-
Amazon Lainnya
-
-
-
Anthropic
-
Anthropic
Harga Sesuai Permintaan dan Batch
Model dengan akses yang diperluas
Penyedia Nama Model Wilayah Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Harga per 1.000 token input (penulisan cache) Harga per 1.000 token input (pembacaan cache) Anthropic Claude 3.5 Sonnet (Akses Diperluas Publik, Efektif 1 Desember 2025) AS Timur (Virginia Utara), AS Timur (Ohio), AS Barat (Oregon), Eropa (Frankfurt), Eropa (Irlandia), Eropa (Zürich), Eropa (Paris) 0,006 USD 0,03 USD 0,003 USD 0,015 USD N/A N/A Anthropic Claude 3.5 Sonnet v2 (Akses Diperluas Publik, Efektif 1 Desember 2025) AS Timur (Virginia Utara), AS Timur (Ohio), AS Barat (Oregon) 0,006 USD 0,03 USD 0,003 USD 0,015 USD 0,0075 USD 0,0006 USD Inferensi yang Dioptimalkan Latensi
Harga Throughput yang Disediakan
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Model Anthropic Harga per jam per model dengan
tidak ada komitmenHarga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Wilayah: Asia Pasifik (Tokyo)
Model Anthropic Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan Claude Instant
53,00 USD
29,00 USD
Claude 2.0/2.1
86,00 USD
48,00 USD
Wilayah: Eropa (Frankfurt)
Model Anthropic Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan Claude Instant
49,00 USD
27,00 USD
Claude 2.0/2.1
79,00 USD
44,00 USD
Silakan hubungi tim akun AWS Anda untuk detail selengkapnya tentang unit model.
-
Cohere
-
Cohere
Harga Sesuai Permintaan
Model Cohere Harga per 1.000 kueri** Rerank 3.5 2,00 USD **Anda dikenakan biaya untuk jumlah kueri di mana kueri dapat berisi hingga 100 potongan dokumen. Jika kueri berisi lebih dari 100 potongan dokumen, itu dihitung sebagai beberapa kueri. Misalnya, jika permintaan berisi 350 dokumen, itu akan diperlakukan sebagai 4 kueri. Perhatikan bahwa setiap dokumen hanya dapat berisi hingga 500 token (termasuk kueri dan token total dokumen), dan jika panjang token lebih tinggi dari 512 token, itu dipecah menjadi beberapa dokumen. Harga untuk kustomisasi (penyempurnaan)
*Total token yang dilatih = jumlah token dalam korpus data pelatihan x jumlah epoch
Harga Provisioned Throughput
Model Cohere Harga per jam per model
tanpa komitmenHarga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan
Cohere Command
49,50 USD 39,60 USD
23,77 USD
Cohere Command - Light 8,56 USD 6,85 USD
4,11 USD Embed 3 English 7,12 USD 6,76 USD
6,41 USD Embed 3 Multilingual 7,12 USD 6,76 USD
6,41 USD Hubungi tim akun atau penjualan AWS Anda untuk mendapatkan detail selengkapnya tentang unit model.
-
DeepSeek
-
DeepSeek
Harga Sesuai Permintaan
-
Google
-
Google
Harga Sesuai Permintaan
Wilayah: AS Timur (Virginia Utara), AS Timur (Ohio), dan AS Barat (Oregon)
Model Google Harga per 1.000 token input Harga per 1.000 token output Gemma 3 4B 0,00004 USD 0,00008 USD Gemma 3 12B 0,00009 USD 0,00029 USD Gemma 3 27B 0,00023 USD 0,00038 USD Wilayah: Asia Pasifik (Mumbai), Eropa (Irlandia), dan Eropa (Milan)
Model Google Harga per 1.000 token input Harga per 1.000 token output Gemma 3 4B 0,00005 USD 0,00009 USD Gemma 3 12B 0,00011 USD 0,00034 USD Gemma 3 27B 0,00027 USD 0,00045 USD Wilayah: Amerika Selatan (Sao Paulo) dan Asia Pasifik (Tokyo)
Model Google Harga per 1.000 token input Harga per 1.000 token output Gemma 3 4B 0,00005 USD 0,00010 USD Gemma 3 12B 0,00011 USD 0,00035 USD Gemma 3 27B 0,00028 USD 0,00046 USD Wilayah Eropa (London)
Model Google Harga per 1.000 token input Harga per 1.000 token output Gemma 3 4B 0,00006 USD 0,00012 USD Gemma 3 12B 0,00014 USD 0,00045 USD Gemma 3 27B 0,00036 USD 0,00059 USD * Harga tingkat Prioritas berada pada premi 75% dibandingkan harga tingkat Standar
* Harga tingkat Flex mendapatkan diskon 50% dibandingkan harga tingkat Standar -
Kimi AI
-
Kimi AI
Harga Sesuai Permintaan
Wilayah: AS Timur (Virginia Utara), AS Timur (Ohio), dan AS Barat (Oregon)
Model Kimi Harga per 1.000 token input Harga per 1.000 token output Kimi K2 Thinking 0,00060 USD 0,00250 USD Wilayah: Asia Pasifik (Mumbai)
Model Kimi Harga per 1.000 token input Harga per 1.000 token output Kimi K2 Thinking 0,00071 USD 0,00294 USD Wilayah: Amerika Selatan (Sao Paulo) dan Asia Pasifik (Tokyo)
Model Kimi Harga per 1.000 token input Harga per 1.000 token output Kimi K2 Thinking 0,00073 USD 0,00303 USD * Harga tingkat Prioritas berada pada premi 75% dibandingkan harga tingkat Standar
* Harga tingkat Flex mendapatkan diskon 50% dibandingkan harga tingkat Standar -
Luma AI
-
Harga Sesuai Permintaan
-
Meta
-
Meta
Llama 4
Harga Sesuai Permintaan dan Batch
Llama 3.3
Harga Sesuai Permintaan dan Batch
Llama 3.2
Harga Sesuai Permintaan dan Batch
Harga untuk kustomisasi model (penyempurnaan)
Harga Throughput yang Disediakan
Llama 3.1
Harga Sesuai Permintaan dan Batch
Harga untuk kustomisasi model (penyempurnaan)
Harga Throughput yang Disediakan
Llama 3
Harga Sesuai Permintaan
Llama 2
Harga Sesuai Permintaan
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Model Meta Harga per 1.000 token input Harga per 1.000 token output Llama 2 Chat (13B)
0,00075 USD
0,001 USD
Llama 2 Chat (70B) 0.00195 USD
0,00256 USD Harga untuk kustomisasi model (penyempurnaan)
Model Meta Harga untuk melatih 1.000 token Harga untuk menyimpan setiap model khusus* per bulan Harga untuk inferensi model khusus untuk 1 unit model per jam (dengan harga Provisioned Throughput tanpa komitmen) Llama 2 Pretrained (13B)
0,00149 USD
1,95 USD
23,50 USD
Llama 2 Pretrained (70B) 0,00799 USD
1,95 USD 23,50 USD *Penyimpanan model khusus = 1,95 USD
Harga Provisioned Throughput
Model Meta Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan Llama 2 Pretrained and Chat (13B)
21,18 USD
13,08 USD
Llama 2 Pretrained (70B) 21,18 USD
13,08 USD *Model Llama 2 Pre-trained hanya tersedia dalam provisioned throughput setelah penyesuaian.
Hubungi tim akun atau penjualan AWS Anda untuk detail selengkapnya tentang unit model.
-
MiniMax AI
-
MiniMax AI
Harga Sesuai Permintaan
Wilayah: AS Timur (Virginia Utara), AS Timur (Ohio), dan AS Barat (Oregon)
Model Minimax Harga per 1.000 token input Harga per 1.000 token output Minimax M2 0,00030 USD 0,00120 USD Wilayah: Asia Pasifik (Mumbai), Eropa (Irlandia), dan Eropa (Milan)
Model Minimax Harga per 1.000 token input Harga per 1.000 token output Minimax M2 0,00035 USD $0.00141 Wilayah: Amerika Selatan (Sao Paulo) dan Asia Pasifik (Tokyo)
Model Minimax Harga per 1.000 token input Harga per 1.000 token output Minimax M2 0,00036 USD 0,00145 USD Wilayah Eropa (London)
Model Minimax Harga per 1.000 token input Harga per 1.000 token output Minimax M2 0,00047 USD 0,00186 USD * Harga tingkat Prioritas berada pada premi 75% dibandingkan harga tingkat Standar
* Harga tingkat Flex mendapatkan diskon 50% dibandingkan harga tingkat Standar -
Mistral AI
-
Mistral AI
Harga Sesuai Permintaan
Wilayah: AS Timur (Virginia Utara), AS Timur (Ohio), dan AS Barat (Oregon)
Model Mistral Harga per 1.000 token input Harga per 1.000 token output Magistral Small 1.2 0,00050 USD 0,00150 USD Voxtral Mini 1.0 0,00004 USD 0,00004 USD Voxtral Small 1.0 0,00010 USD 0,00030 USD Ministral 3B 3.0 0,00010 USD 0,00010 USD Ministral 8B 3.0 0,00015 USD 0,00015 USD Ministral 14B 3.0 0,00020 USD 0,00020 USD Mistral Large 3 0,00050 USD 0,00150 USD Wilayah: Asia Pasifik (Mumbai)
Model Mistral Harga per 1.000 token input Harga per 1.000 token output Magistral Small 1.2 0,00059 USD 0,00176 USD Voxtral Mini 1.0 0,00005 USD 0,00005 USD Voxtral Small 1.0 0,00012 USD 0,00035 USD Ministral 3B 3.0 0,00012 USD 0,00012 USD Ministral 8B 3.0 0,00018 USD 0,00018 USD Ministral 14B 3.0 0,00024 USD 0,00024 USD Mistral Large 3 0,00059 USD 0,00176 USD Wilayah: Amerika Selatan (Sao Paulo) dan Asia Pasifik (Tokyo)
Model Mistral Harga per 1.000 token input Harga per 1.000 token output Magistral Small 1.2 0,00061 USD 0,00182 USD Voxtral Mini 1.0 0,00005 USD 0,00005 USD Voxtral Small 1.0 0,00012 USD 0,00036 USD Ministral 3B 3.0 0,00012 USD 0,00012 USD Ministral 8B 3.0 0,00018 USD 0,00018 USD Ministral 14B 3.0 0,00024 USD 0,00024 USD Mistral Large 3 0,00061 USD 0,00182 USD Wilayah: Eropa (Irlandia) dan Eropa (Milan)
Model Mistral Harga per 1.000 token input Harga per 1.000 token output Magistral Small 1.2 0,00059 USD 0,00176 USD Voxtral Mini 1.0 0,00005 USD 0,00005 USD Voxtral Small 1.0 0,00012 USD 0,00035 USD Ministral 3B 3.0 0,00012 USD 0,00012 USD Ministral 8B 3.0 0,00018 USD 0,00018 USD Ministral 14B 3.0 0,00024 USD 0,00024 USD Wilayah Eropa (London)
Model Mistral Harga per 1.000 token input Harga per 1.000 token output Magistral Small 1.2 0,00078 USD 0,00233 USD Voxtral Mini 1.0 0,00006 USD 0,00006 USD Voxtral Small 1.0 0,00016 USD 0,00047 USD Ministral 3B 3.0 0,00016 USD 0,00016 USD Ministral 8B 3.0 0,00023 USD 0,00023 USD Ministral 14B 3.0 0,00031 USD 0,00031 USD * Harga tingkat Prioritas berada pada premi 75% dibandingkan harga tingkat Standar
* Harga tingkat Flex mendapatkan diskon 50% dibandingkan harga tingkat Standar -
NVIDIA
-
NVIDIA
Harga Sesuai Permintaan
Wilayah: AS Timur (Virginia Utara), AS Timur (Ohio), dan AS Barat (Oregon)
Model NVIDIA Harga per 1.000 token input Harga per 1.000 token output NVIDIA Nemotron Nano 2 0,00006 USD 0,00023 USD NVIDIA Nemotron Nano 2 VL 0,00020 USD 0,00060 USD Wilayah: Asia Pasifik (Mumbai), Eropa (Irlandia), dan Eropa (Milan)
Model NVIDIA Harga per 1.000 token input Harga per 1.000 token output NVIDIA Nemotron Nano 2 0,00007 USD 0,00027 USD NVIDIA Nemotron Nano 2 VL 0,00024 USD 0,00071 USD Wilayah: Amerika Selatan (Sao Paulo) dan Asia Pasifik (Tokyo)
Model NVIDIA Harga per 1.000 token input Harga per 1.000 token output NVIDIA Nemotron Nano 2 0,00007 USD 0,00028 USD NVIDIA Nemotron Nano 2 VL 0,00024 USD 0,00073 USD Wilayah Eropa (London)
Model NVIDIA Harga per 1.000 token input Harga per 1.000 token output NVIDIA Nemotron Nano 2 0,00009 USD 0,00036 USD NVIDIA Nemotron Nano 2 VL 0,00031 USD 0,00093 USD * Harga tingkat Prioritas berada pada premi 75% dibandingkan harga tingkat Standar
* Harga tingkat Flex mendapatkan diskon 50% dibandingkan harga tingkat Standar -
OpenAI
-
OpenAI
Harga Sesuai Permintaan
Wilayah: AS Timur (Virginia Utara), AS Timur (Ohio), dan AS Barat (Oregon)
Model OpenAI Harga per 1.000 token input Harga per 1.000 token output GPT OSS Safeguard 20B 0,00007 USD 0,00020 USD GPT OSS Safeguard 120B 0,00015 USD 0,00060 USD Wilayah: Asia Pasifik (Mumbai), Amerika Selatan (Sao Paulo), dan Asia Pasifik (Tokyo)
Model OpenAI Harga per 1.000 token input Harga per 1.000 token output GPT OSS Safeguard 20B 0,00008 USD 0,00024 USD GPT OSS Safeguard 120B 0,00018 USD 0,00071 USD Wilayah: Eropa (Irlandia) dan Eropa (Milan)
Model OpenAI Harga per 1.000 token input Harga per 1.000 token output GPT OSS Safeguard 20B 0,00008 USD 0,00023 USD GPT OSS Safeguard 120B 0,00018 USD 0,00070 USD Wilayah Eropa (London)
Model OpenAI Harga per 1.000 token input Harga per 1.000 token output GPT OSS Safeguard 20B 0,00011 USD 0,00031 USD GPT OSS Safeguard 120B 0,00023 USD 0,00093 USD * Harga tingkat Prioritas berada pada premi 75% dibandingkan harga tingkat Standar
* Harga tingkat Flex mendapatkan diskon 50% dibandingkan harga tingkat Standar -
TwelveLabs
-
TwelveLabs
Harga Sesuai Permintaan
-
Stability AI
-
Stability AI
Harga Sesuai Permintaan
Pembuatan sebelumnya dari model gambar yang ditawarkan oleh Stability AI dihargai per gambar, bergantung pada jumlah langkah dan resolusi gambar.
Wilayah: Oregon, Virginia Utara, Ohio
Layanan Gambar Stability AI Harga per pembuatan untuk setiap model Penghapusan Latar Belakang Stable Image 0,07 USD Penghapusan Objek Stable Image 0,07 USD Kontrol Struktur Stable Image 0,07 USD Kontrol Sketsa Stable Image 0,07 USD Panduan Gaya Stable Image 0,07 USD Pencarian dan Penggantian Stable Image 0,07 USD Inpaint Stable Image 0,07 USD Pencarian dan Pewarnaan Ulang Stable Image 0,07 USD Transfer Gaya Stable Image 0,08 USD Peningkatan Konservatif Stable Image 0,40 USD Peningkatan Kreatif Stable Image 0,60 USD Peningkatan Cepat Stable Image 0,03 USD Outpaint Stable Image 0,06 USD -
Writer
-
Penulis
Harga sesuai permintaan
Model penulis Harga per 1.000 token input Harga per 1.000 token output Palmyra X4 0,0025 USD 0,010 USD Palmyra X5 0,0006 USD 0,006 USD -
Qwen
-
Qwen
Harga Sesuai Permintaan
Wilayah: AS Timur (Virginia Utara), AS Timur (Ohio), dan AS Barat (Oregon)
Model Qwen Harga per 1.000 token input Harga per 1.000 token output Qwen3 Next 80B A3B 0,00015 USD 0,00120 USD Qwen3 VL 235B A22B 0,00053 USD 0,00266 USD Wilayah: Asia Pasifik (Mumbai), Eropa (Irlandia), dan Eropa (Milan)
Model Qwen Harga per 1.000 token input Harga per 1.000 token output Qwen3 Next 80B A3B 0,00018 USD $0.00141 Qwen3 VL 235B A22B 0,00062 USD 0,00313 USD Wilayah: Amerika Selatan (Sao Paulo) dan Asia Pasifik (Tokyo)
Model Qwen Harga per 1.000 token input Harga per 1.000 token output Qwen3 Next 80B A3B 0,00018 USD 0,00145 USD Qwen3 VL 235B A22B 0,00064 USD 0,00322 USD Wilayah Eropa (London)
Model Qwen Harga per 1.000 token input Harga per 1.000 token output Qwen3 Next 80B A3B 0,00023 USD 0,00186 USD Qwen3 VL 235B A22B 0,00082 USD 0,00412 USD * Harga tingkat Prioritas berada pada premi 75% dibandingkan harga tingkat Standar
* Harga tingkat Flex mendapatkan diskon 50% dibandingkan harga tingkat Standar -
Impor Model Kustom
-
Impor Model Kustom
-
Llama
-
Llama Multimodal
-
Mistral
-
Mixtral
-
Flan
-
Qwen
-
OpenAI
-
Llama
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,05718 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Wilayah: Eropa (Frankfurt)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,07144 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Catatan: Unit Model Kustom yang diperlukan untuk meng-host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat impor. Sebagai referensi, model Llama 3.1 8B 128K membutuhkan 2 Unit Model Kustom, model Llama 3.1 70B 128k membutuhkan 8 Unit Model Kustom.
*Ditagih dalam periode 5 menit
-
Llama Multimodal
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,05718 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Wilayah: Eropa (Frankfurt)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,07144 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Catatan: Unit Model Kustom yang diperlukan untuk meng-host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat impor. Sebagai referensi, model Llama 3.1 8B 128K membutuhkan 2 Unit Model Kustom, model Llama 3.1 70B 128k membutuhkan 8 Unit Model Kustom.
*Ditagih dalam periode 5 menit
-
Mistral
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,05718 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Wilayah: Eropa (Frankfurt)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,07144 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Catatan: Unit Model Kustom yang diperlukan untuk meng-host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat impor. Sebagai referensi, model Llama 3.1 8B 128K membutuhkan 2 Unit Model Kustom, model Llama 3.1 70B 128k membutuhkan 8 Unit Model Kustom.
*Ditagih dalam periode 5 menit
-
Mixtral
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,05718 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Wilayah: Eropa (Frankfurt)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,07144 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Catatan: Unit Model Kustom yang diperlukan untuk meng-host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat impor. Sebagai referensi, model Llama 3.1 8B 128K membutuhkan 2 Unit Model Kustom, model Llama 3.1 70B 128k membutuhkan 8 Unit Model Kustom.
*Ditagih dalam periode 5 menit
-
Flan
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,05718 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Wilayah: Eropa (Frankfurt)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,07144 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Catatan: Unit Model Kustom yang diperlukan untuk meng-host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat impor. Sebagai referensi, model Llama 3.1 8B 128K membutuhkan 2 Unit Model Kustom, model Llama 3.1 70B 128k membutuhkan 8 Unit Model Kustom.
*Ditagih dalam periode 5 menit
Harga Inferensi Sesuai Permintaan:
Anda ditagih dalam periode 5 menit selama salinan model Anda aktif, dimulai dari invokasi pertama yang berhasil. Batas throughput dan konkurensi maksimum per salinan model bergantung pada faktor-faktor seperti, campuran token input/output, tipe perangkat keras, ukuran model, arsitektur, optimisasi inferensi, dan ditentukan selama alur kerja impor model.Bedrock menskalakan jumlah salinan model secara otomatis tergantung pada pola penggunaan Anda. Jika tidak ada invokasi selama periode 5 menit, Bedrock akan menurunkan skala menjadi nol dan menaikkan kembali skala saat Anda menginvokasi model. Saat menaikkan kembali skala, Anda mungkin mengalami durasi pemulaian dingin (dalam puluhan detik) tergantung pada ukuran model. Bedrock juga menaikkan skala jumlah salinan model jika volume inferensi Anda secara konsisten melebihi batas konkurensi dari satu salinan model. Catatan: Terdapat batas maksimum default sebanyak 3 salinan model per akun untuk setiap model yang diimpor, yang dapat ditingkatkan melalui Service Quotas.
-
Qwen
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,05718 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Wilayah: Eropa (Frankfurt)
Versi Unit Model Kustom v1.0 Harga per Unit Model Kustom per menit* 0,07144 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Catatan: Unit Model Kustom yang diperlukan untuk meng-host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat impor. Sebagai referensi, model Llama 3.1 8B 128K membutuhkan 2 Unit Model Kustom, model Llama 3.1 70B 128k membutuhkan 8 Unit Model Kustom.
*Ditagih dalam periode 5 menit
Harga Inferensi Sesuai Permintaan:
Anda ditagih dalam periode 5 menit selama salinan model Anda aktif, dimulai dari invokasi pertama yang berhasil. Batas throughput dan konkurensi maksimum per salinan model bergantung pada faktor-faktor seperti, campuran token input/output, tipe perangkat keras, ukuran model, arsitektur, optimisasi inferensi, dan ditentukan selama alur kerja impor model.Bedrock menskalakan jumlah salinan model secara otomatis tergantung pada pola penggunaan Anda. Jika tidak ada invokasi selama periode 5 menit, Bedrock akan menurunkan skala menjadi nol dan menaikkan kembali skala saat Anda menginvokasi model. Saat menaikkan kembali skala, Anda mungkin mengalami durasi pemulaian dingin (dalam puluhan detik) tergantung pada ukuran model. Bedrock juga menaikkan skala jumlah salinan model jika volume inferensi Anda secara konsisten melebihi batas konkurensi dari satu salinan model. Catatan: Terdapat batas maksimum default sebanyak 3 salinan model per akun untuk setiap model yang diimpor, yang dapat ditingkatkan melalui Service Quotas.
-
OpenAI
-
Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)
Versi Unit Model Kustom v2.0 Harga per Unit Model Kustom per menit* 0,1433 USD Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD Catatan: Unit Model Kustom yang diperlukan untuk meng-host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat impor. Sebagai referensi, model Llama 3.1 8B 128K membutuhkan 2 Unit Model Kustom, model Llama 3.1 70B 128k membutuhkan 8 Unit Model Kustom.
*Ditagih dalam periode 5 menit
Harga Inferensi Sesuai Permintaan:
Anda ditagih dalam periode 5 menit selama salinan model Anda aktif, dimulai dari invokasi pertama yang berhasil. Batas throughput dan konkurensi maksimum per salinan model bergantung pada faktor-faktor seperti, campuran token input/output, tipe perangkat keras, ukuran model, arsitektur, optimisasi inferensi, dan ditentukan selama alur kerja impor model.Bedrock menskalakan jumlah salinan model secara otomatis tergantung pada pola penggunaan Anda. Jika tidak ada invokasi selama periode 5 menit, Bedrock akan menurunkan skala menjadi nol dan menaikkan kembali skala saat Anda menginvokasi model. Saat menaikkan kembali skala, Anda mungkin mengalami durasi pemulaian dingin (dalam puluhan detik) tergantung pada ukuran model. Bedrock juga menaikkan skala jumlah salinan model jika volume inferensi Anda secara konsisten melebihi batas konkurensi dari satu salinan model. Catatan: Terdapat batas maksimum default sebanyak 3 salinan model per akun untuk setiap model yang diimpor, yang dapat ditingkatkan melalui Service Quotas.
-
Detail harga alat dan optimisasi
-
Alur
-
Basis Pengetahuan
-
Pagar Pembatas
-
Evaluasi Model
-
Otomatisasi Data
-
Perutean Prompt Cerdas
-
Optimisasi Prompt
-
Alur
-
Amazon Bedrock Flows
Anda akan dikenakan biaya berdasarkan jumlah transisi simpul yang diperlukan untuk menjalankan aplikasi Anda. Bedrock Flows menghitung transisi simpul setiap kali simpul dalam alur kerja Anda dijalankan. Anda dikenai biaya untuk jumlah total transisi simpul di seluruh alur Anda.
Semua biaya diukur setiap hari dan ditagih setiap bulan mulai tanggal 1 Februari 2025.
Harga per 1.000 transisi simpul 0,035 USD Biaya Tambahan
Anda dapat dikenai biaya tambahan jika eksekusi alur kerja aplikasi Anda memanfaatkan layanan AWS atau transfer data lain. Misalnya, jika alur kerja Anda menginvokasi kebijakan Pagar Pembatas Amazon Bedrock, Anda akan ditagih untuk jumlah unit teks yang diproses oleh kebijakan tersebut.
-
Basis Pengetahuan
-
Structured Data Retrieval (Pembuatan SQL)
Structured Data Retrieval dikenakan biaya untuk setiap permintaan untuk menghasilkan kueri SQL. Kueri SQL yang dihasilkan digunakan untuk mengambil data dari penyimpanan data terstruktur.
Model Rerank
Model Rerank dirancang untuk meningkatkan relevansi dan akurasi respons dalam aplikasi Retrieval Augmented Generation (RAG). Mereka dikenakan biaya per kueri.
**Anda dikenakan biaya untuk jumlah kueri di mana kueri dapat berisi hingga 100 potongan dokumen. Jika kueri berisi lebih dari 100 potongan dokumen, itu dihitung sebagai beberapa kueri. Misalnya, jika permintaan berisi 350 dokumen, itu akan diperlakukan sebagai 4 kueri. Perhatikan bahwa setiap dokumen hanya dapat berisi hingga 512 token (termasuk kueri dan token total dokumen), dan jika panjang token lebih tinggi dari 512 token, itu dipecah menjadi beberapa dokumen. Sebuah kueri setara dengan unit pencarian.
-
Pagar Pembatas
-
Batasan Pengaman Amazon Bedrock
Harga untuk Batasan Pengaman Amazon Bedrock didasarkan pada biaya yang timbul dari filter yang digunakan dalam batasan pengaman. Harga sama untuk tingkat standar dan tingkat klasik.
Filter batasan pengaman
Harga
Filter konten untuk tingkat standar dan tingkat klasik (konten teks) 0,15 USD per 1.000 unit teks
Filter konten (konten gambar)
0,00075 USD per gambar yang diproses
Topik yang ditolak untuk tingkat standar dan tingkat klasik
0,15 USD per 1.000 unit teks
Filter informasi sensitif
0,10 USD per 1.000 unit teks
Filter informasi sensitif (ekspresi reguler)
Gratis
Filter kata
Gratis
Pemeriksaan landasan kontekstual
0,10 USD per 1.000 unit teks
Pemeriksaan Penalaran Otomatis
0,17 USD per 1.000 unit teks per kebijakan Penalaran Otomatis
Harga Sesuai Permintaan
* Setiap filter batasan pengaman bersifat opsional dan dapat diaktifkan sesuai dengan kebutuhan aplikasi Anda. Biaya akan dikenakan berdasarkan tipe filter yang digunakan dalam batasan pengaman. Sebagai contoh, jika sebuah batasan pengaman dikonfigurasi dengan filter konten dan topik yang ditolak, biaya akan dikenakan untuk kedua filter tersebut, sementara tidak ada biaya yang terkait dengan filter informasi sensitif.
Catatan: Satu unit teks dapat berisi hingga 1000 karakter. Jika berisi lebih dari 1000 karakter, input teks diproses sebagai lebih dari satu unit teks, yang masing-masingnya berisi 1000 karakter atau kurang. Misalnya, jika berisi 5600 karakter, input teks akan ditagih biaya untuk 6 unit teks.Pemeriksaan landasan kontekstual menggunakan sumber referensi dan kueri untuk menentukan apakah respons model didasarkan pada sumber dan relevan dengan kueri. Total jumlah unit teks yang ditagih biaya dihitung dengan menggabungkan semua karakter dalam sumber, kueri, dan respons model.
-
Evaluasi Model
-
Evaluasi Model
Evaluasi model dikenai biaya untuk inferensi dari model pilihan Anda. Skor algoritmik yang dihasilkan secara otomatis disediakan tanpa biaya tambahan. Untuk evaluasi berbasis manusia, saat membawa tim kerja Anda sendiri, Anda dikenai biaya untuk inferensi model dalam evaluasi, dan biaya sebesar 0,21 USD per tugas manusia yang diselesaikan.
Model
Harga per 1.000 token input
Harga per 1.000 token output
Harga per tugas manusia
Model yang dipilih untuk evaluasi
Berdasarkan model yang dipilih
Berdasarkan model yang dipilih
0,21 USD
-
Otomatisasi Data
-
Otomatisasi Data
Basis Pengetahuan Amazon Bedrock menawarkan integrasi Otomatisasi Data Bedrock untuk memberikan respons yang lebih relevan dan akurat untuk data multimodal. Saat menyiapkan Basis Pengetahuan, Anda dapat memilih Otomatisasi Data Bedrock sebagai metode penguraian Anda untuk menganalisis dan mengekstrak wawasan yang berarti dari gambar atau dokumen, yang dapat mencakup gambar, bagan, dan diagram. Selama pemrosesan, Otomatisasi Data Bedrock mengekstrak informasi yang berarti dari dokumen dan gambar yang dicerna, yang kemudian digunakan dalam langkah-langkah Basis Pengetahuan berikutnya untuk pemotongan, penyematan, dan penyimpanan. Ketika terintegrasi dengan Basis Pengetahuan, Otomatisasi Data Bedrock memberikan dan mengenakan biaya untuk output standar.
-
Perutean Prompt Cerdas
-
Titik Harga Dimensi Harga Rencana Harga Perutean Prompt Cerdas 1 USD per 1.000 permintaan Sesuai Permintaan Perutean Prompt Cerdas
Perutean Prompt Cerdas memungkinkan Anda menggunakan kombinasi model fondasi (FM) dari keluarga model yang sama untuk membantu mengoptimalkan kualitas dan biaya. Misalnya, dengan keluarga model Claude Anthropic, Amazon Bedrock dapat merutekan permintaan secara cerdas antara Claude 3.5 Sonnet dan Claude 3 Haiku tergantung pada kompleksitas prompt. Demikian pula, Amazon Bedrock dapat merutekan permintaan antara Meta Llama 3.3 70B dan 3.18B, dan Nova Pro dan Nova Lite. Perute prompt memprediksi model mana yang akan memberikan performa terbaik untuk setiap permintaan sekaligus membantu mengoptimalkan kualitas respons dan biaya. Hal ini sangat berguna untuk aplikasi seperti asisten layanan pelanggan, di mana kueri yang tidak rumit dapat ditangani oleh model yang lebih kecil, lebih cepat, dan lebih hemat biaya, dan kueri kompleks dialihkan ke model yang lebih mumpuni. Perutean Prompt Cerdas dapat mengurangi biaya hingga 30 persen tanpa mengorbankan akurasi.
-
Optimisasi Prompt
-
Optimisasi Prompt untuk Amazon Bedrock
Anda dikenai biaya berdasarkan jumlah token dalam prompt input dan dalam prompt yang dioptimalkan.
Semua penagihan dilakukan setiap bulan mulai 23 April 2025.
Harga per 1.000 token 0,030 USD
Contoh harga
-
AI21 labs
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Jurassic-2 Mid AI21 untuk meringkas input sebesar 10 ribu token teks input menjadi output sebesar 2 ribu token.
Total biaya yang timbul = 10 ribu token / 1000 * 0,0125 USD + 2 ribu token / 1000 * 0,0125 USD = 0,15 USD
-
Amazon
Harga Sesuai Permintaan
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock setiap jam: Permintaan ke model Amazon Titan Text – Lite untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.
Total biaya per jam yang dikeluarkan adalah = 2 ribu token/1.000 * 0,0003 USD + 1 ribu token/1.000 * 0,0004 USD = 0,001 USD.
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model dasar Amazon Titan Image Generator untuk menghasilkan 1000 gambar berukuran 1024 x 1024 dengan kualitas standar.
Total biaya yang dikeluarkan = 1.000 gambar * 0,01 USD per gambar = 10 USD
Harga kustomisasi (penyempurnaan dan prapelatihan lanjutan)
Developer aplikasi menyesuaikan model Amazon Titan Image Generator menggunakan 1000 pasangan gambar-teks. Setelah pelatihan, developer menggunakan provisioned throughput model khusus selama 1 jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama 1 bulan. Setelah evaluasi, developer menggunakan provisioned throughput (masa komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.
Biaya bulanan yang dikeluarkan untuk Penyempurnaan adalah: Pelatihan penyempurnaan (0,005 USD * 500 * 64). Pada kalkulasi tersebut, 0,005 USD adalah harga per gambar yang dilihat, 500 adalah jumlah langkah, dan 64 adalah ukuran batch + penyimpanan model khusus per bulan (1,95 USD) + 1 jam inferensi model khusus (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD
Harga Provisioned Throughput
Developer aplikasi membeli dua unit model Amazon Titan Text Express dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.
Total biaya bulanan yang dikeluarkan = 2 unit model * 18,40 USD/jam * 24 jam * 31 hari = 27.379,20 USD
Developer aplikasi membeli satu unit model dari model dasar Amazon Titan Image Generator dengan komitmen 1 bulan.
Total biaya yang timbul = 1 unit model * 16,20 USD * 24 jam * 31 hari = 12.052,80 USD
-
Pagar Pembatas Amazon Bedrock
Contoh 1: Chatbot dukungan pelanggan
Pengembang aplikasi membuat chatbot dukungan pelanggan dan menggunakan filter konten untuk memblokir konten berbahaya dan topik yang ditolak untuk menyaring pertanyaan dan tanggapan yang tidak diinginkan.
Chatbot melayani 1000 permintaan pengguna per jam. Setiap permintaan pengguna memiliki panjang input rata-rata 200 karakter dan menerima respons FM 1500 karakter.
Setiap permintaan pengguna 200 karakter sesuai dengan 1 unit teks.
Setiap respons FM 1.500 karakter sesuai dengan 2 unit teks.
Unit teks diproses setiap jam = (1 + 2) * 1000 kueri = 3000 unit teks
Total biaya yang dikeluarkan per jam untuk filter konten dan topik yang ditolak = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USDContoh 2: Ringkasan transkrip pusat panggilan
Pengembang aplikasi membuat aplikasi untuk meringkas transkrip obrolan antara pengguna dan agen dukungan. Ini menggunakan filter informasi sensitif untuk menyunting informasi pengenal pribadi (PII) dalam ringkasan yang dihasilkan untuk 10.000 percakapan.
Setiap ringkasan yang dihasilkan memiliki rata-rata 3.500 karakter yang sesuai dengan 4 unit teks.
Total biaya yang dikeluarkan untuk meringkas 10.000 percakapan = 10000 * 4 * (0,1 USD/1000) = 4 USDContoh 3: Mesin Verifikasi Protokol Medis
Sebuah perusahaan teknologi layanan kesehatan mengimplementasikan pemeriksaan Penalaran Otomatis dalam sistem dukungan keputusan klinis mereka untuk memvalidasi saran perawatan terhadap pedoman medis.Sistem ini memproses 5.000 kasus pasien per bulan. Setiap kasus meliputi:
- Ringkasan data pasien: 500 karakter (1 unit teks)
- Penilaian diagnostik: 2.000 karakter (2 unit teks)
- Rekomendasi perawatan: 4.500 karakter (5 unit teks)
Unit teks yang diproses per bulan = (1 + 2 + 5) 5.000 kasus = 40.000 unit teks
Total biaya yang dikeluarkan per bulan untuk pemeriksaan Penalaran Otomatis = 40.000 (0,17 USD)/1000 = 6,80 USD -
Basis Pengetahuan Amazon Bedrock
Contoh Harga 1 (Peringkat ulang menggunakan model Amazon Rerank 1.0)
Pada bulan tertentu, Anda membuat 2 juta permintaan ke API Rerank menggunakan model Amazon Rerank 1.0 – 1 juta permintaan berisi kurang dari 100 dokumen masing-masing dan karena itu akan dikenakan biaya untuk masing-masing satu permintaan. 1 juta permintaan sisanya berisi 120-150 dokumen, dan karena itu setiap permintaan akan dikenakan biaya untuk 2 permintaan.
Harga untuk satu permintaan = 0,001 USD
Total biaya = 1.000.000 * 0,001 USD + 1.000.000 * 2 * 0,001 USD = 3000 USDContoh Harga 2: (Pengambilan data terstruktur)
Developer aplikasi membuat chatbot dukungan yang melakukan kueri data terstruktur yang disimpan di Amazon Redshift. Developer membuat Basis Pengetahuan Bedrock dan terhubung ke Amazon Redshift. Chatbot melayani 10000 kueri pengguna per jam. Setiap kueri pengguna akan dikenakan biaya 0,002 USD per API GenerateQuery untuk menghasilkan SQL dari kueri pengguna.
Total biaya yang dikeluarkan untuk menghasilkan SQL per jam = 0,002 USD * 10000 = 20 USD.
Total biaya yang timbul dalam sebulan = 20 USD * 24 * 30 = 1440 USD -
Anthropic
Harga Sesuai Permintaan
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock di Wilayah AS Barat (Oregon): Permintaan ke model Claude Anthropic untuk meringkas input sebesar 11 ribu token teks input menjadi output sebesar 4 ribu token.
Total biaya yang dikeluarkan = 11 ribu token/1000 * 0,008 USD + 4 ribu token/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Harga Provisioned Throughput
Developer aplikasi membeli satu unit model Anthropic Claude Instant di Wilayah AS Barat (Oregon):
Total biaya bulanan yang timbul = 1 unit model * 39,60 USD * 24 jam * 31 hari = 29.462,40 USD
-
Cohere
Harga On-Demand
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: permintaan ke model Command Cohere untuk meringkas input sebesar 6 ribu token teks input menjadi output sebesar 2 ribu token.
Total biaya yang dikeluarkan = 6 ribu token/1.000 * 0,0015 USD + 2 ribu token/1.000 * 0,0020 USD = 0,013 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Command-Light Cohere untuk meringkas input sebesar 6 ribu token teks input menjadi output sebesar 2 ribu token.
Total biaya yang dikeluarkan = 6 ribu token/1000 * 0,0003 USD + 2 ribu token/1000 * 0,0006 USD = 0,003 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Embed English atau Embed Multilingual Cohere untuk menghasilkan penyematan untuk 10 ribu token input.
Total biaya yang dikeluarkan = 10 ribu token/1000 * 0,0001 USD = 0,001 USD
Harga kustomisasi (penyempurnaan)
Developer aplikasi menyesuaikan model Cohere Command menggunakan 1.000 token data. Setelah pelatihan, menggunakan provisioned throughput model khusus selama 1 jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama 1 bulan. Setelah evaluasi, developer menggunakan provisioned throughput (komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.
Biaya bulanan yang dikeluarkan untuk penyempurnaan adalah: Pelatihan penyempurnaan (0,004 USD * 1000) + penyimpanan model khusus per bulan (1,95 USD) + 1 jam inferensi model khusus (49,50 USD) = 55,45 USD
Biaya bulanan yang dikeluarkan untuk provisioned throughput (komitmen 1 bulan) dari model khusus = 39,60 USD
Harga Provisioned Throughput
Developer aplikasi membeli satu unit model Cohere Command dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.
Total biaya bulanan yang timbul = 1 unit model * 39,60 USD * 24 jam * 31 hari = 29.462,40 USD
-
Impor Model Kustom
Contoh Harga: Developer aplikasi mengimpor model tipe Llama 3.1 yang disesuaikan dengan ukuran parameter 8B dengan panjang urutan 128K di wilayah us-east-1 dan menghapus model setelah 1 bulan. Hal ini membutuhkan 2 Unit Model Kustom. Jadi, harga per menit akan menjadi 0,1570 USD karena diperlukan 2 Unit Model Kustom. Biaya penyimpanan model untuk 2 Unit Model Kustom adalah 3,90 USD untuk bulan tersebut.
Tidak ada biaya untuk mengimpor model. Invokasi pertama yang berhasil adalah pukul 8.03, saat pengukuran dimulai. Periode pengukuran 5 menit dimulai pukul 8.03 – 8.07; 8.07 –8.11, dan seterusnya. Jika ada setidaknya satu invokasi selama periode 5 menit, periode tersebut akan dianggap aktif untuk penagihan. Jika ada invoaksi pada pukul 08.03 dan tidak ada invokasi lebih lanjut setelah pukul 08.07, pengukuran akan berhenti pada pukul 08.07. Dalam kasus ini, tagihan akan dihitung sebagai berikut: 0,1570 USD * 5 menit * 1 periode lima menit = 0,785 USD.
-
Otomatisasi Data
Contoh harga 1:
Katakanlah Anda memproses dokumen 1.000 halaman menggunakan BDA Custom Output. Semua 1.000 halaman diproses menggunakan cetak biru 1 yang memiliki 15 bidang. Harga per halaman untuk cetak biru dengan 30 bidang atau kurang adalah 0,040 USD. Total biayanya adalah 40 USD.
Total halaman yang diproses = 1.000
Harga per halaman untuk cetak biru dengan kurang dari 30 bidang = 0,040 USD
Total biaya = 1.000 * 0,040 USD = 40 USDContoh harga 2:
Katakanlah Anda memproses 2 dokumen menggunakan BDA Custom Output. Dokumen 1 memiliki 40 halaman dan diproses menggunakan cetak biru 1 yang memiliki 20 bidang. Dokumen 2 memiliki 10 halaman dan diproses menggunakan cetak biru 2, yang memiliki 40 bidang. Harga per halaman untuk cetak biru 1 adalah 0,040 USD karena cetak biru tersebut memiliki 30 bidang atau kurang. Harga per halaman cetak biru 2 adalah 0,045 USD. Biaya pemrosesan untuk Dokumen 1 menggunakan cetak biru 1 adalah 1,60 USD. Biaya pemrosesan untuk Dokumen 2 menggunakan cetak biru 2 adalah 0,45 USD. Total biaya pemrosesan kedua dokumen adalah 2,05 USD.
Total halaman yang diproses = 50
Harga per halaman untuk Cetak biru 1 dengan kurang dari 30 bidang = 0,040 USD
Harga per halaman untuk Cetak biru 2 dengan 40 bidang = 0,040 USD + (# bidang tambahan di atas 30*0,0005 USD per bidang)
Jumlah bidang tambahan di atas 30 = 40 - 30 = 10
Harga per halaman untuk Cetak biru 2 dengan 40 bidang = 0,040 USD + (10 * 0,0005 USD per bidang) = 0,045 USD
Biaya untuk Dokumen 1 menggunakan Cetak biru 1 = 40 halaman x 0,040 USD per halaman = 1,6 USD
Biaya untuk Dokumen 2 menggunakan Cetak biru 2 = 10 halaman x 0,045 USD per halaman = 0,45 USD
Total biaya = Biaya untuk Dokumen 1 + Biaya untuk Dokumen 2 = 1,6 USD + 0,45 USD = 2,05 USDContoh Harga 3:
Anggaplah Anda mengatur Basis Pengetahuan Bedrock untuk menggunakan Otomatisasi Data Bedrock sebagai pengurai, lalu menyerap dokumen 1.000 halaman. Perhatikan bahwa struktur biaya berbeda-beda antara opsi penguraian Basis Pengetahuan. BDA menggunakan harga per halaman, sementara pengurai Model Fondasi ditagih berdasarkan token input dan output. Sebagai konteks, memproses 1.000 halaman, dengan 30% berisi tabel dan 30% berisi gambar, biasanya memerlukan 2.900 token input dan 750 token output. Konsumsi token bervariasi menurut jenis konten, sehingga pelanggan didorong untuk menguji menggunakan data mereka sendiri untuk mendapatkan perkiraan yang lebih akurat. Basis Pengetahuan Bedrock dan integrasi Otomatisasi Data Bedrock menggunakan output standar, dengan harga per halaman adalah 0,010 USD. Total biayanya adalah 10 USD.Total halaman yang diproses = 1.000
Harga per halaman untuk output standar = 0,010 USD
Total biaya = 1.000 * 0,010 USD = 10 USDContoh harga 4:
Anggaplah Anda memproses video 60 menit menggunakan Output Standar BDA. Harga per menit untuk output standar video adalah 0,050 USD. Total biayanya adalah 3,00 USD.
Total menit diproses = 60
Harga per menit untuk output standar video = 0,050 USD
Total biaya = 60 * 0,050 = 3,00 USDContoh harga 5:
Anggaplah Anda memproses 2.000 gambar menggunakan Output Kustom BDA. 1.000 gambar pertama diproses menggunakan cetak biru 1, yang memiliki 10 bidang. 1.000 halaman terakhir diproses menggunakan cetak biru 2, yang memiliki 40 bidang. Harga per gambar untuk cetak biru 1 adalah 0,005 USD, karena berisi 30 bidang atau kurang. Harga per gambar cetak biru 2 adalah 0,01 USD. Biaya pemrosesan untuk 1.000 gambar pertama menggunakan cetak biru 1 adalah 5,00 USD. Biaya pemrosesan untuk 1.000 gambar kedua menggunakan cetak biru 2 adalah 10,00 USD. Total biaya pemrosesan 2.000 gambar keseluruhan akan menjadi 15,00 USD
Biaya untuk 1000 gambar pertama = 1.000 gambar * 0,005 USD per gambar = 5,00 USD
Biaya untuk 1.000 gambar kedua = 1.000 gambar * (0,005 USD + (# bidang tambahan di atas 30 * 0,0005 USD per bidang))
= 1.000 * (0,005 USD + ((40-30) * 0,0005 USD))
= 1.000 * (0,005 USD + (10 * 0,0005 USD)) = 10,00 USD
Total biaya = 5,00 USD + 10,00 USD = 15,00 USDContoh Harga 6:
Misalkan Anda ingin menggunakan Output Standar Otomatisasi Data Bedrock untuk memproses 15.000 menit rekaman audio rapat di organisasi Anda. Total biaya pemrosesan keseluruhan 15.000 menit audio akan menjadi 90 USD.
Total menit yang diproses = 15.000 menit
Total biaya = 15.000 menit × 0,006 USD = 90 USD -
DeepSeek
Harga Sesuai Permintaan
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock setiap jam: permintaan ke model DeepSeek-R1 untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token (termasuk token penalaran):
Total biaya per jam yang timbul = 2 ribu token / 1000 * 0,00135 USD + 1 ribu token / 1000 * 0,0054 USD = 0,0081 USD
-
Alur
Contoh: Ringkasan berita
Developer aplikasi membuat alur untuk mengotomatiskan ringkasan berita untuk pedagang saham. Alur tersebut mencakup simpul Input yang mengambil lokasi S3, dan simpul pengambilan S3 yang mengambil 10 file yang menyertakan artikel dari 10 kantor berita utama di S3 (2 transisi simpul). Alur tersebut kemudian menggunakan pengulang simpul untuk menginvokasi model dengan simpul prompt untuk meringkas setiap file (+ 10 file x 2 transisi simpul). Alur tersebut kemudian mengumpulkan semua hasil menggunakan simpul kolektor, menulis hasilnya ke S3 menggunakan simpul penyimpanan S3, dan menyelesaikan dalam simpul Output (+ 3 transisi simpul). Mereka menjalankan alur ini setiap setengah jam setiap hari kerja.Jumlah transisi simpul per eksekusi alur adalah: 2 + 1 + 10 * 2 + 3 = 25 transisi simpul/eksekusi aliran
Jumlah eksekusi aliran per bulan adalah: 24 jam * 2 * 5 hari * 4 minggu = 960 eksekusi alur/bulan.
Total tagihan per bulan adalah: 25 * 960 * 0,035 USD/1000 = 0,84 USD
Biaya tambahan
Tagihan tersebut juga akan mencakup biaya tambahan untuk layanan AWS yang digunakan dalam eksekusi alur kerja, termasuk penggunaan Amazon S3 dalam simpul pengambilan dan penyimpanan, serta penggunaan model fondasi Amazon Bedrock dalam simpul prompt. -
Meta
Harga Sesuai Permintaan
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: permintaan ke model Llama 2 Chat (13B) Meta untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 500 token.
Total biaya yang dikeluarkan = 2 ribu token/1000 * 0,00075 USD + 500 token/1000 * 0,001 USD = 0,002 USD
Harga kustomisasi (penyempurnaan)
Developer aplikasi menyesuaikan model Llama 2 Pretrained (70B) menggunakan 1000 token data. Setelah pelatihan, menggunakan provisioned throughput model khusus selama 1 jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama 1 bulan. Setelah evaluasi, developer menggunakan provisioned throughput (komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.
Biaya bulanan yang dikeluarkan untuk penyempurnaan adalah: Pelatihan penyempurnaan (0,00799 USD * 1000) + penyimpanan model khusus per bulan (1,95 USD) + 1 jam inferensi model khusus (23,50 USD) = 33,44 USD
Biaya bulanan yang dikeluarkan untuk provisioned throughput (komitmen 1 bulan) dari model khusus = 21,18 USD
Harga Provisioned Throughput
Developer aplikasi membeli satu unit model Meta Llama 2 dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.
Total biaya bulanan yang timbul = 1 unit model * 21,18 USD * 24 jam * 31 hari = 15.757,92 USD
-
Mistral AI
Harga Sesuai Permintaan
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: Permintaan ke model Mistral 7B untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.
Total biaya per jam yang dikeluarkan = 2 ribu token/1000 * 0,00015 USD + 1 ribu token/1000 * 0,0002 USD = 0,0005 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: permintaan ke model Mixtral 8x7B untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.
Total biaya per jam yang dikeluarkan = 2 ribu token/1000 * 0,00045 USD + seribu token/1000 * 0,0007 USD = 0,0016 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: permintaan ke model Mistral Large untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.
Total biaya per jam yang timbul = 2 ribu token / 1000 * 0,008 USD + 1 ribu token / 1000 * 0,024 USD = 0,04 USD
-
Evaluasi model
Contoh evaluasi model 1:
Harga on-demand
Developer aplikasi mengirimkan set data untuk evaluasi model berbasis manusia menggunakan Anthropic Claude 2.1 dan Anthropic Claude Instant di Wilayah AWS AS Timur (Virginia Utara).Set data berisi 50 perintah, dan developer memerlukan satu pekerja untuk menilai setiap rangkaian respons perintah (dapat dikonfigurasi dalam pembuatan tugas evaluasi sebagai parameter “pekerja per perintah”).
Akan ada 50 tugas dalam pekerjaan evaluasi ini (satu tugas untuk setiap set respons cepat per setiap pekerja). Sebanyak 50 perintah digabungkan menjadi 5000 token input, dan respons terkait digabungkan menjadi 15,000 token untuk Anthropic Claude Instant dan 20,000 token untuk Anthropic Claude 2.1.
Biaya berikut dikeluarkan untuk tugas evaluasi model ini:Item Jumlah token input Harga per 1.000 token input Biaya input Jumlah token output Harga per 1.000 token output Biaya output Jumlah tugas manusia Biaya per tugas manusia Biaya tugas manusia Total Claude Instant Inference 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD 0,52 USD Tugas Manusia 50 0,21 USD 10,50 USD 10,50 USD Total 11,06 USD Contoh evaluasi model 2:
Harga on-demand
Developer aplikasi mengirimkan set data untuk evaluasi model berbasis manusia menggunakan Anthropic Claude 2.1 dan Anthropic Claude Instant di Wilayah AWS AS Timur (Virginia Utara).
Set data berisi 50 perintah, dan developer memerlukan dua pekerja untuk menilai setiap rangkaian respons perintah (dapat dikonfigurasi dalam pembuatan tugas evaluasi sebagai parameter “pekerja per perintah”). Akan ada 100 tugas dalam tugas evaluasi ini (1 tugas untuk setiap set respons-perintah per setiap pekerja: 2 pekerja x 50 rangkaian respons-perintah = 100 tugas manusia).
Sebanyak 50 perintah digabungkan menjadi 5.000 token input, dan respons terkait digabungkan menjadi 15.000 token untuk Anthropic Claude Instant dan 20.000 token untuk Anthropic Claude 2.1.
Biaya berikut dikeluarkan untuk tugas evaluasi model ini:Item Jumlah token input Harga per 1.000 token input Biaya input Jumlah token output Harga per 1.000 token output Biaya output Jumlah tugas manusia Biaya per tugas manusia Biaya tugas manusia Total Claude Instant Inference 5.000 0,0008 USD 0,0040 USD 15.000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5.000 0,008 USD 0,0400 USD 20.000 0,024 USD 0,48 USD 0,52 USD Tugas Manusia 100 0,21 USD 21,00 USD 21,00 USD Total 21,56 USD -
Optimisasi Prompt
Contoh: Ringkasan berita
Developer aplikasi membuat prompt untuk meringkas berita bagi trader menggunakan Claude 3.5. Prompt asli mencakup 429 token. Prompt yang dioptimalkan memiliki 511 token, dan mencakup instruksi dan contoh yang lebih spesifik untuk menghasilkan jawaban yang lebih ringkas dari FM. Ia menggunakan prompt yang dioptimalkan dengan 511 token sebagai input untuk pengoptimal prompt, dan membuat 2 varian baru untuk Claude 3.7 serta Nova Pro dengan 582 dan 579 token.Jumlah total token input dan output untuk optimisasi prompt: 429 + 511 + 511 + 582 + 511 + 579 = 3.123
Total tagihan per bulan adalah: 3.123 / 1000 * 0,03 USD = 0,09 USD
-
Stability AI
Harga On-Demand
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: permintaan ke model SDXL untuk menghasilkan gambar 512 x 512 dengan ukuran langkah sebesar 70 (kualitas premium).
Total biaya yang dikeluarkan = 1 gambar * 0,036 USD per gambar = 0,036 USD
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model SDXL 1.0 untuk menghasilkan gambar berukuran 1024 x 1024 dengan ukuran langkah sebesar 70 (kualitas premium).
Total biaya yang dikeluarkan = 1 gambar * 0,08 USD per gambar = 0,08 USD
Harga Provisioned Throughput
Developer aplikasi membeli satu unit model SDXL 1.0 dengan komitmen 1 bulan.
Total biaya yang dikeluarkan = 1 * 49,86 USD * 24 jam * 31 hari = 37.095,84 USD
-
TwelveLabs
Harga Sesuai Permintaan
Developer aplikasi membuat panggilan API berikut ke Amazon Bedrock: permintaan ke model Pegasus 1.2 untuk menjelaskan apa isi video sepanjang 10 detik, yang memberikan output 2.000 token.
Total biaya yang dikeluarkan = 10 detik * 0,00049 USD + 2 ribu token/1000 * 0,0075 USD = 0,0199 USD
Developer aplikasi membuat panggilan API berikut ke Amazon Bedrock: permintaan ke model Marengo Embed [3.0 atau 2.7] untuk menyematkan 10 video, dengan durasi gabungan 100 menit.Total biaya yang dikeluarkan = 100 menit (yaitu 6000 detik) * 0,00070 USD = 4,2 USD
Developer aplikasi membuat panggilan API berikut ke Amazon Bedrock: permintaan ke model Marengo Embed 3.0 dengan menyediakan teks dan gambar bersama, untuk menghasilkan sematan yang dapat mereka gunakan untuk menemukan klip yang memiliki tas yang ditampilkan dalam gambar yang diberikan, di seluruh repositori penyematan yang akan mereka buat menggunakan contoh di atas.Total biaya yang dikeluarkan = 1 permintaan teks * 0,00007 USD + 1 permintaan gambar * 0,0001 USD = 0,00017 USD
Developer aplikasi membuat panggilan API berikut ke Amazon Bedrock: permintaan ke model Marengo Embed [3.0 atau 2.7] dengan menyediakan teks untuk menghasilkan sematan yang dapat mereka gunakan untuk menemukan klip yang cocok dari repositori penyematan yang akan mereka buat menggunakan contoh di atas.Total biaya yang dikeluarkan = 1 permintaan teks * 0,00007 USD = 0,00007 USD
-
Writer
Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Palmyra X5 milik Penulis untuk meringkas input sebesar 10 ribu token teks input menjadi output sebesar 2 ribu token.
Total biaya yang dikeluarkan = 10 ribu token/1000 * 0,003 USD + 2 ribu token/1000 * 0,015 USD = 0,06 USD