Harga Amazon Bedrock

Ikhtisar harga

Amazon Bedrock adalah layanan terkelola penuh yang menawarkan pilihan model fondasi (FM) beperforma tinggi melalui satu API, bersama dengan serangkaian kemampuan luas yang Anda perlukan untuk membangun aplikasi AI generatif yang menyederhanakan pengembangan dengan keamanan, privasi, dan AI yang bertanggung jawab.

Dengan Amazon Bedrock, Anda akan dikenai biaya untuk inferensi dan kustomisasi model. Anda memiliki pilihan dua paket harga untuk inferensi: 1/ Sesuai Permintaan dan Batch: Mode ini memungkinkan Anda menggunakan FM berdasarkan bayar sesuai pemakaian tanpa harus membuat komitmen jangka waktu berbasis waktu. 2/ Throughput yang Disediakan: Mode ini memungkinkan Anda menyediakan throughput yang cukup untuk memenuhi persyaratan performa aplikasi Anda sebagai ganti komitmen jangka waktu berbasis waktu.

Model harga

On-Demand

Dengan mode On-Demand, Anda hanya membayar untuk apa yang Anda gunakan, tanpa komitmen periode berbasis waktu. Untuk model pembuatan teks, Anda dikenai biaya untuk setiap token input yang diproses dan setiap token output yang dihasilkan. Untuk model penyematan, Anda dikenai biaya untuk setiap token input yang diproses. Token terdiri dari beberapa karakter dan mengacu pada unit dasar teks yang dipelajari model untuk memahami input dan perintah pengguna. Untuk model pembuatan gambar, Anda dikenai biaya untuk setiap gambar yang dihasilkan.

Batch

Dengan mode Batch, Anda dapat memberikan satu set perintah sebagai file input tunggal dan menerima tanggapan sebagai file output tunggal sehingga memungkinkan Anda mendapatkan prediksi skala besar secara simultan. Tanggapan diproses dan disimpan di bucket Amazon S3 sehingga Anda dapat mengaksesnya pada lain waktu. Harga untuk mode Batch sama dengan harga untuk mode On-Demand.

Provisioned Throughput

Dengan mode Provisioned Throughput, Anda dapat membeli unit model untuk model dasar atau khusus tertentu. Mode Provisioned Throughput terutama dirancang untuk beban kerja inferensi konsisten besar yang membutuhkan throughput yang terjamin. Model khusus hanya dapat diakses menggunakan Provisioned Throughput. Unit model menyediakan throughput tertentu, yang diukur dengan jumlah maksimum token input atau output yang diproses setiap menitnya. Dengan harga Provisioned Throughput, Anda dikenai biaya per jam, dan memiliki fleksibilitas untuk memilih antara periode komitmen 1 bulan atau 6 bulan.

Kustomisasi model

Dengan Amazon Bedrock, Anda dapat menyesuaikan FM dengan data Anda untuk memberikan respons yang disesuaikan untuk tugas tertentu dan konteks bisnis Anda. Anda dapat menyempurnakan model dengan data berlabel atau menggunakan pra-pelatihan lanjutan dengan data tanpa label. Untuk penyesuaian model pembuatan teks, Anda dikenai biaya untuk pelatihan model berdasarkan jumlah total token yang diproses oleh model (jumlah token dalam korpus data pelatihan dikalikan jumlah epoch), dan untuk penyimpanan model yang dikenai biaya per bulan per model. Epoch mengacu pada satu pass penuh melalui kumpulan data pelatihan Anda selama penyempurnaan atau pra-pelatihan lanjutan. Inferensi menggunakan model khusus dikenai biaya berdasarkan paket Provisioned Throughput, dan mengharuskan Anda membeli Provisioned Throughput. Satu unit model tersedia tanpa periode komitmen untuk inferensi pada model yang disesuaikan. Anda akan dikenai biaya untuk jumlah jam unit model pertama yang Anda gunakan untuk inferensi model khusus. Jika Anda ingin meningkatkan throughput melebihi satu unit model, Anda harus membeli periode komitmen 1 bulan atau 6 bulan.

Alat canggih untuk membangun tanpa biaya tambahan

Saat menggunakan Agen untuk Amazon Bedrock dan Basis Pengetahuan untuk Amazon Bedrock, Anda hanya dikenai biaya untuk model dan basis data vektor yang Anda gunakan dengan kemampuan ini.

Perincian harga

Harga tergantung pada modalitas, penyedia, dan model. Silakan pilih penyedia model untuk melihat harga terperinci.

AI21 Labs

Harga On-Demand dan Batch

Model AI21 Labs Harga per 1.000 token input Harga per 1.000 token output

Jurassic-2 Mid

0,0125 USD

0,0125 USD

Jurassic-2 Ultra

0,0188 USD

0,0188 USD

Saat ini, kustomisasi model (penyempurnaan) dan Provisioned Throughput tidak didukung untuk model AI21 Labs di Amazon Bedrock.

Amazon

Region

Anthropic

Harga On-Demand dan Batch

Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

Model Anthropic Harga per 1.000 token input Harga per 1.000 token output

Claude Instant

0,00080 USD

0,00240 USD

Claude 2.0/2.1

0,00800 USD

0,02400 USD

Claude 3 Opus*

0,01500 USD

0,07500 USD

Claude 3 Sonnet

0,00300 USD

0,01500 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

* Claude 3 Opus saat ini tersedia di wilayah AS Barat (Oregon).

Wilayah: Asia Pasifik (Sydney)

Model Anthropic Harga per 1.000 token input Harga per 1.000 token output

Claude 3 Sonnet

0,00300 USD

0,01500 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

Wilayah: Eropa (Paris)

Model Anthropic Harga per 1.000 token input Harga per 1.000 token output

Claude 3 Sonnet

0,00300 USD

0,01500 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

Wilayah: Asia Pasifik (Tokyo)

Model Anthropic Harga per 1.000 token input Harga per 1.000 token output

Claude Instant

0,00080 USD

0,00240 USD

Claude 2.0/2.1

0,00800 USD

0,02400 USD

Wilayah: Eropa (Frankfurt)

Model Anthropic Harga per 1.000 token input Harga per 1.000 token output

Claude Instant

0,00080 USD

0,00240 USD

Claude 2.0/2.1

0,00800 USD

0,02400 USD

Harga Provisioned Throughput:

Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

Model Anthropic Harga per jam per model dengan
tidak ada komitmen
Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

Claude Instant

44,00 USD

39,60 USD

22,00 USD

Claude 2.0/2.1

70,00 USD

63,00 USD

35,00 USD

Model Anthropic Harga per jam per model dengan
tidak ada komitmen
Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

Claude Instant

44,00 USD

39,60 USD

22,00 USD

Claude 2.0/2.1

70,00 USD

63,00 USD

35,00 USD

Wilayah: Asia Pasifik (Tokyo)

Model Anthropic Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

Claude Instant

53,00 USD

29,00 USD

Claude 2.0/2.1

86,00 USD

48,00 USD

Wilayah: Eropa (Frankfurt)

Model Anthropic Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

Claude Instant

49,00 USD

27,00 USD

Claude 2.0/2.1

79,00 USD

44,00 USD

Silakan hubungi tim akun AWS Anda untuk detail selengkapnya tentang unit model. 

Cohere

Harga On-Demand dan Batch

Model Cohere Harga per 1.000 token input Harga per 1.000 token output
Command 0,0015 USD 0,0020 USD
Command-Light 0,0003 USD 0,0006 USD
Embed - English 0,0001 USD N/A
Embed - Multilingual 0,0001 USD N/A

Harga untuk kustomisasi (penyempurnaan)

Model Cohere Harga untuk melatih 1.000 token Harga untuk menyimpan setiap model khusus per bulan Harga untuk inferensi model khusus per unit model per jam (dengan harga Provisioned Throughput tanpa komitmen)

Cohere Command

0,004 USD

1,95 USD

49,50 USD

Cohere Command-Light 0,001 USD

1,95 USD

8,56 USD

*Total token yang dilatih = jumlah token dalam korpus data pelatihan x jumlah epoch

Harga Provisioned Throughput:

Model Cohere Harga per jam per model 
tanpa komitmen
Harga per jam per unit model untuk komitmen 1 bulan

Harga per jam per unit model untuk komitmen 6 bulan

Cohere Command

49,50 USD

39,60 USD

23,77 USD

Cohere Command-Light 8,56 USD

6,85 USD

4,11 USD
Sematkan - Bahasa Inggris 7,12 USD

6,76 USD

6,41 USD
Embed - Multibahasa 7,12 USD

6,76 USD

6,41 USD

Hubungi tim akun atau penjualan AWS Anda untuk detail selengkapnya mengenai unit model. 

Meta Llama 2

Harga On-Demand dan Batch 

Model Meta Harga per 1.000 token input Harga per 1.000 token output

Llama 2 Chat (13B)

0,00075 USD

0,00100 USD

Llama 2 Chat (70B)

0.00195 USD

0,00256 USD

Harga untuk kustomisasi model (penyempurnaan)

Model Meta Harga untuk melatih 1.000 token Harga untuk menyimpan setiap model khusus* per bulan Harga untuk inferensi model khusus untuk 1 unit model per jam (dengan harga Provisioned Throughput tanpa komitmen)

Llama 2 Pre-trained (13B)

0,00149 USD

1,95 USD

23,50 USD

Llama 2 Pre-trained (70B)

0,00799 USD

1,95 USD 23,50 USD

*Penyimpanan model khusus = 1,95 USD

Harga Provisioned Throughput:

Model Meta Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

Llama 2 Pre-trained dan Chat (13B)

21,18 USD

13,08 USD

Llama 2 Pre-trained (70B)

21,18 USD

13,08 USD

*Model Llama 2 Pre-trained hanya tersedia dalam provisioned throughput setelah penyesuaian.

Hubungi tim akun atau penjualan AWS Anda untuk detail selengkapnya tentang unit model.

Mistral AI

Harga sesuai permintaan - Wilayah: AS Timur (Virgina Utara), AS Barat (Oregon)

Model Mistral AI Harga per 1.000 token input Harga per 1.000 token output
Mistral 7B

0,00015 USD

0,0002 USD

Mixtral 8*7B

0,00045 USD

0,0007 USD
Mistral Large 0,008 USD 0,024 USD

Harga sesuai permintaan - Wilayah: Eropa (Paris), Asia Pasifik (Sydney)

Model Mistral AI Harga per 1.000 token input Harga per 1.000 token output
Mistral 7B

0,0002 USD

0,00026 USD

Mixtral 8*7B

0,00059 USD

0,00091 USD
Mistral Large 0,0104 USD 0,0312 USD
Region

Stability AI

Harga On-Demand dan Batch

Model gambar yang ditawarkan oleh Stability AI dihargai per gambar, tergantung pada jumlah langkah dan resolusi gambar:

Model Stabilty AI Resolusi gambar Harga per gambar yang dihasilkan untuk kualitas standar (<=50 langkah) Harga per gambar yang dihasilkan untuk kualitas premium (>50 langkah)

 

SDXL 0.8

512 x 512 atau lebih kecil

0,018 USD per gambar

0,036 USD per gambar

Lebih besar dari 512 x 512

0,036 USD per gambar

0,072 USD per gambar

SDXL 1.0

Hingga 1024 x 1024

0,04 USD 0,08 USD

Harga Provisioned Throughput:

Model Stabilty AI Harga per jam per unit model untuk komitmen 1 bulan* Harga per jam per unit model untuk komitmen 6 bulan*

SDXL 1.0

49,86 USD

46,18 USD

*Termasuk inferensi untuk model dasar dan khusus.

Hubungi tim akun atau penjualan AWS Anda untuk detail lebih lanjut tentang unit model.

Saat ini, kustomisasi model (penyempurnaan) tidak didukung untuk model Stability AI di Amazon Bedrock.

Contoh harga

  • Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Jurassic-2 Mid AI21 untuk meringkas input sebesar 10 ribu token teks input menjadi output sebesar 2 ribu token.

    Total biaya yang dikeluarkan adalah = 10 ribu token/1.000 * 0,0125 USD + 2 ribu token/1.000 * 0,0125 USD = 0,15 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock setiap jam: Permintaan ke model Amazon Titan Text – Lite untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.

    Total biaya per jam yang dikeluarkan adalah = 2 ribu token/1.000 * 0,0003 USD + 1 ribu token/1.000 * 0,0004 USD = 0,001 USD.

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model dasar Titan Image Generator untuk menghasilkan 1.000 gambar berukuran 1024 x 1024 dengan kualitas standar

    Total biaya yang dikeluarkan = 1.000 gambar * 0,01 USD per gambar = 10 USD

    Harga kustomisasi (penyempurnaan dan pra-pelatihan lanjutan)

    Developer aplikasi menyesuaikan model Titan Image Generation menggunakan 1.000 pasangan gambar-teks. Setelah pelatihan, developer menggunakan provisioned throughput model khusus selama satu jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama satu bulan. Setelah evaluasi, developer menggunakan provisioned throughput (komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.

    Biaya bulanan yang dikeluarkan untuk penyempurnaan adalah: Pelatihan penyempurnaan (0,005 USD * 500 * 64). Pada kalkulasi tersebut, 0,005 USD adalah harga per gambar yang dilihat, 500 adalah jumlah langkah, dan 64 adalah ukuran batch + penyimpanan model khusus per bulan (1,95 USD) + satu jam inferensi model khusus (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli dua unit model Titan Text Express dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.

    Total biaya bulanan yang dikeluarkan = 2 unit model * 18,40 USD/jam * 24 jam * 31 hari = 27.379,20 USD

    Developer aplikasi membeli satu unit model dari model dasar Titan Image Generator dengan komitmen 1 bulan.

    Total biaya yang dikeluarkan = 1 * 16,20 USD * 24 jam * 31 hari = 12.052,80 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock di wilayah AS Barat (Oregon): Permintaan ke model Claude Anthropic untuk meringkas input sebesar 11 ribu token teks input menjadi output sebesar 4 ribu token.

    Total biaya yang dikeluarkan adalah 11 ribu token/1.000 * 0,008 USD + 4 ribu token/1.000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli satu unit model Anthropic Claude Instant di wilayah AS Barat (Oregon):

    Total biaya bulanan yang dikeluarkan adalah 1 unit model * 39,60 USD * 24 jam * 31 hari = 29.462,40 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Command Cohere untuk meringkas input sebesar 6 ribu token teks input menjadi output sebesar 2 ribu token.

    Total biaya yang dikeluarkan adalah = 6 ribu token/1.000 * 0,00150 USD + 2 ribu token/1.000 * 0,0020 USD = 0,013 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Command-Light Cohere untuk meringkas input sebesar 6 ribu token teks input menjadi output sebesar 2 ribu token.

    Total biaya yang dikeluarkan adalah = 6 ribu token/1.000 * 0,0003 USD + 2 ribu token/1.000 * 0,0006 USD = 0,003 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Embed English atau multilingual Cohere untuk menghasilkan penyematan untuk 10 ribu token input.

    Total biaya yang dikeluarkan adalah = 10 ribu token/1.000 * 0,0001 USD = 0,001 USD

    Harga kustomisasi (penyempurnaan)

    Developer aplikasi menyesuaikan model command Cohere menggunakan 1.000 token data. Setelah pelatihan, menggunakan provisioned throughput model khusus selama satu jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama satu bulan. Setelah evaluasi, developer menggunakan provisioned throughput (komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.

    Biaya bulanan yang dikeluarkan untuk penyempurnaan adalah: Pelatihan penyempurnaan (0,004 USD * 1.000) + penyimpanan model khusus per bulan (1,95 USD) + satu jam inferensi model khusus (49,50 USD) = 55,45 USD

    Biaya bulanan yang dikeluarkan untuk provisioned throughput (komitmen 1 bulan) dari model khusus = 39,60 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli satu unit model Cohere Command dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.

    Total biaya bulanan yang dikeluarkan adalah 1 unit model * 39,60 USD * 24 jam * 31 hari = 29.462,40 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Llama 2 Chat (13B) Meta untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 500 token.

    Total biaya yang dikeluarkan adalah = 2 ribu token/1.000 * 0,00075 USD + 500 token/1.000 * 0,001 USD = 0,002 USD

    Harga kustomisasi (penyempurnaan)

    Developer aplikasi menyesuaikan model Llama 2 Pre-trained (70B) menggunakan 1.000 token data. Setelah pelatihan, menggunakan provisioned throughput model khusus selama satu jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama satu bulan. Setelah evaluasi, developer menggunakan provisioned throughput (komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.

    Biaya bulanan yang dikeluarkan untuk penyempurnaan adalah: Pelatihan penyempurnaan (0,00799 USD * 1.000) + penyimpanan model khusus per bulan (1,95 USD) + satu jam inferensi model khusus (23,50 USD) = 33,44 USD

    Biaya bulanan yang dikeluarkan untuk provisioned throughput (komitmen 1 bulan) dari model khusus = 21,18 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli satu unit model Meta Llama 2 dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.

    Total biaya bulanan yang dikeluarkan adalah 1 unit model * 21,20 USD * 24 jam * 31 hari = 15.772,8 USD

  • Harga Sesuai Permintaan

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: Permintaan ke model Mistral 7B untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.

    Total biaya per jam yang dikeluarkan adalah = 2 ribu token/1.000 * 0,00015 USD + 1 ribu token/1.000 * 0,0002 USD = 0,0005 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: Permintaan ke model Mixtral 8x7B untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.

    Total biaya per jam yang dikeluarkan adalah = 2 ribu token/1.000 * 0,00045 USD + seribu token/1.000 * 0,0007 USD = 0,0016 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: Permintaan ke model Mistral Large untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token. 

    Total biaya per jam yang dikeluarkan adalah = 2 ribu token/1.000 * 0,008 USD + seribu token/1.000 * 0,024 USD = 0,04 USD

  • Harga Sesuai Permintaan

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model SDXL untuk menghasilkan gambar berukuran 512 x 512 dengan ukuran langkah sebesar 70 (kualitas premium)

    Total biaya yang dikeluarkan = 1 gambar * 0,036 USD per gambar = 0,036 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model SDXL1.0 untuk menghasilkan gambar berukuran 1024 x 1024 dengan ukuran langkah sebesar 70 (kualitas premium)

    Total biaya yang dikeluarkan = 1 gambar * 0,08 USD per gambar = 0,08 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli satu unit model SDXL1.0 dengan komitmen 1 bulan.

    Total biaya yang dikeluarkan = 1 * 49,86 USD * 24 jam * 31 hari = 37.095,84 USD