Preços do Amazon Bedrock
Visão geral da definição de preço
O Amazon Bedrock é um serviço totalmente gerenciado que oferece uma variedade de modelos de base (FMs) por meio de uma única API de alta performance, juntamente com um amplo conjunto de recursos necessários para criar aplicações de IA generativa, simplificando o desenvolvimento com segurança, privacidade e IA responsável.
Com o Amazon Bedrock, a cobrança é feita com base na inferência e na personalização de modelos. Você pode escolher entre dois planos de preços para inferência: 1/Sob demanda e em lote: esse modo permite usar FMs com base no pagamento conforme o uso, sem precisar assumir compromisso com base no tempo. 2/Throughput provisionada: esse modo permite provisionar uma throughput suficiente para atender aos requisitos de performance da sua aplicação em troca de um compromisso de prazo baseado em tempo.
Modelos de preços
Sob demanda
Com o modo sob demanda, você paga apenas pelo que usa, sem compromissos de prazo baseados em tempo. Para modelos de geração de texto, você é cobrado por cada token de entrada processado e por cada token de saída gerado. Para modelos de incorporação, você é cobrado por cada token de entrada processado. Um token é composto por alguns caracteres e se refere à unidade básica de texto que um modelo aprende para entender a entrada e a solicitação do usuário. Para modelos de geração de imagem, você é cobrado por cada imagem gerada.
Lote
Com o modo em lote, você pode fornecer um conjunto de solicitações como um único arquivo de entrada e receber respostas como um único arquivo de saída, permitindo que você obtenha previsões simultâneas em grande escala. As respostas são processadas e armazenadas em seu bucket do Amazon S3 para que você possa acessá-las posteriormente. O preço do modo em lote é o mesmo do modo sob demanda.
Throughput provisionado
Com o modo de throughput provisionado, você pode comprar unidades de modelo para um modelo de base específico ou personalizado. O modo de throughput provisionado foi projetado principalmente para grandes workloads de inferência consistentes que precisam de throughput garantido. Modelos personalizados só podem ser acessados usando throughput provisionado. Uma unidade modelo fornece uma determinado throughput, que é medida pelo número máximo de tokens de entrada ou saída processados por minuto. Com o preço de throughput provisionado, você é cobrado por hora e tem a flexibilidade de escolher entre termos de compromisso de 1 mês ou de 6 meses.
Personalização de modelos
Com o Amazon Bedrock, você pode personalizar as FMs com seus dados para fornecer respostas personalizadas para tarefas específicas e seu contexto de negócios. Você pode refinar os modelos com dados rotulados ou usar o pré-treinamento contínuo com dados não rotulados. Para personalizar um modelo de geração de texto, você é cobrado pelo treinamento do modelo com base no número total de tokens processados pelo modelo (número de tokens no corpus de dados de treinamento vezes o número de epochs) e pelo armazenamento do modelo, é cobrado por mês por modelo. Um epoch se refere a uma passagem completa pelo conjunto de dados de treinamento durante o ajuste fino ou o pré-treinamento contínuo. As inferências usando modelos personalizados são cobradas de acordo com o plano de throughput provisionado e exigem que você compre o throughput provisionado. Uma unidade de modelo é disponibilizada sem termo de compromisso para inferência em um modelo personalizado. Você será cobrado pelo número de horas da primeira unidade de modelo usada para inferência de modelo personalizado. Se você quiser aumentar seu throughput para além de uma unidade modelo, deverá adquirir um termo de compromisso de 1 mês ou de 6 meses.
Ferramentas poderosas para criação sem custo adicional
Ao usar Atendentes do Amazon Bedrock e bases de conhecimento do Amazon Bedrock, você só é cobrado pelos modelos e bancos de dados de vetores que você usa com esses recursos.
Detalhamento de preços
O preço depende da modalidade, do fornecedor e do modelo. Selecione o fornecedor do modelo para ver os preços detalhados.
AI21 Labs
Preços sob demanda e em lote
Modelos AI21 Labs | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Jurassic-2 Mid |
USD 0,0125 |
USD 0,0125 |
Jurassic-2 Ultra |
USD 0,0188 |
USD 0,0188 |
Atualmente, a personalização do modelo (ajuste fino) e o throughput provisionado não são compatíveis com os modelos da AI21 Labs no Amazon Bedrock.
Amazon
Anthropic
Preços sob demanda e em lote
Região: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Modelos da Anthropic | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Claude Instant |
USD 0,00080 |
USD 0,00240 |
Claude 2.0/2.1 |
USD 0,00800 |
USD 0,02400 |
Claude 3 Opus |
USD 0,01500 |
USD 0,07500 |
Claude 3 Sonnet |
USD 0,00300 |
USD 0,01500 |
Claude 3 Haiku |
USD 0,00025 |
USD 0,00125 |
*O Claude 3 Opus está disponível na região do Oeste dos EUA (Oregon) no momento. |
Região da AWS: Ásia-Pacífico (Sydney)
Modelos da Anthropic | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Claude 3 Sonnet |
USD 0,00300 |
USD 0,01500 |
Claude 3 Haiku |
USD 0,00025 |
USD 0,00125 |
Região da AWS: Europa (Paris)
Modelos da Anthropic | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Claude 3 Sonnet |
USD 0,00300 |
USD 0,01500 |
Claude 3 Haiku |
USD 0,00025 |
USD 0,00125 |
Região: Ásia-Pacífico (Tóquio)
Modelos da Anthropic | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Claude Instant |
USD 0,00080 |
USD 0,00240 |
Claude 2.0/2.1 |
USD 0,00800 |
USD 0,02400 |
Região: Europa (Frankfurt)
Modelos da Anthropic | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Claude Instant |
USD 0,00080 |
USD 0,00240 |
Claude 2.0/2.1 |
USD 0,00800 |
USD 0,02400 |
Preços para throughput provisionada:
Região: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Modelos da Anthropic | Preço por hora por modelo sem compromisso |
Preço por hora por unidade de modelo para compromisso de 1 mês | Preço por hora por unidade modelo para compromisso de 6 meses |
Claude Instant |
USD 44,00 | USD 39,60 |
USD 22,00 |
Claude 2.0/2.1 |
USD 70,00 | USD 63,00 |
USD 35,00 |
Modelos da Anthropic | Preço por hora por modelo sem compromisso |
Preço por hora por unidade de modelo para compromisso de 1 mês | Preço por hora por unidade modelo para compromisso de 6 meses |
Claude Instant |
USD 44,00 | USD 39,60 |
USD 22,00 |
Claude 2.0/2.1 |
USD 70,00 | USD 63,00 |
USD 35,00 |
Região: Ásia-Pacífico (Tóquio)
Modelos da Anthropic | Preço por hora por unidade de modelo para compromisso de 1 mês | Preço por hora por unidade modelo para compromisso de 6 meses |
Claude Instant |
USD 53,00 |
USD 29,00 |
Claude 2.0/2.1 |
USD 86,00 |
USD 48,00 |
Região: Europa (Frankfurt)
Modelos da Anthropic | Preço por hora por unidade de modelo para compromisso de 1 mês | Preço por hora por unidade modelo para compromisso de 6 meses |
Claude Instant |
USD 49,00 |
USD 27,00 |
Claude 2.0/2.1 |
USD 79,00 |
USD 44,00 |
Entre em contato com sua equipe de contas da AWS para obter mais detalhes sobre unidades de modelo.
Cohere
Preços sob demanda e em lote
Modelos do Cohere | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Command | USD 0,0015 | USD 0.0020 |
Command-Light | USD 0,0003 | USD 0,0006 |
Embed – Inglês | USD 0,0001 | N/D |
Embed – Multilíngue | USD 0,0001 | N/D |
Preços para personalização (ajuste fino)
Modelos do Cohere | Preço para treinar 1.000 tokens | Preço para armazenar cada modelo personalizado por mês | Preço a ser inferido de um modelo personalizado por unidade de modelo por hora (com preços de throughput provisionado sem compromisso) |
Cohere Command |
USD 0,004 |
USD 1,95 |
USD 49,50 |
Cohere Command-Light | USD 0,001 | USD 1,95 |
USD 8,56 |
*Total de tokens treinados = número de tokens no corpus de dados de treinamento x número de epochs
Preços para throughput provisionada:
Modelos do Cohere | Preço por hora por modelo sem compromisso |
Preço por hora por unidade de modelo para compromisso de 1 mês | Preço por hora por unidade modelo para compromisso de 6 meses |
Cohere Command |
USD 49,50 | USD 39,60 |
USD 23,77 |
Cohere Command-Light | USD 8,56 | USD 6,85 |
USD 4,11 |
Embed – Inglês | USD 7,12 | USD 6,76 |
USD 6,41 |
Embed – Multilíngue | USD 7,12 | USD 6,76 |
USD 6,41 |
Entre em contato com sua equipe de contas ou vendas da AWS para obter mais detalhes sobre unidades de modelo.
Meta Llama 2
Preços sob demanda e em lote
Modelos do Meta | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Llama 2 Chat (13B) |
USD 0,00075 |
USD 0,00100 |
Llama 2 Chat (70B) | USD 0,00195 |
USD 0,00256 |
Preços para personalização de modelos (ajuste fino)
Modelos do Meta | Preço para treinar 1.000 tokens | Preço para armazenar cada modelo personalizado* por mês | Preço a ser inferido de um modelo personalizado para 1 unidade de modelo por hora (com preços de throughput provisionado sem compromisso) |
Llama 2 pré-treinado (13B) |
USD 0,00149 |
USD 1,95 |
USD 23,50 |
Llama 2 pré-treinado (70B) | USD 0,00799 |
USD 1,95 | USD 23,50 |
*Armazenamento de modelo personalizado = USD 1,95
Preços para throughput provisionada:
Modelos do Meta | Preço por hora por unidade de modelo para compromisso de 1 mês | Preço por hora por unidade modelo para compromisso de 6 meses |
Llama 2 pré-treinado e Chat (13B) |
USD 21,18 |
USD 13,08 |
Llama 2 pré-treinado (70B) | USD 21,18 |
USD 13,08 |
*Os modelos pré-treinados do Llama 2 estão disponíveis somente em throughput provisionado após a personalização.
Entre em contato com sua equipe de contas ou vendas da AWS para obter mais detalhes sobre unidades de modelo.
Mistral AI
Preços sob demanda - Regiões: Leste dos EUA (Norte da Virgina), Oeste dos EUA (Oregon)
Modelo da Mistral AI | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Mistral 7B | USD 0,00015 |
USD 0,0002 |
Mixtral 8*7B | USD 0,00045 |
USD 0,0007 |
Mistral Grande | USD 0,008 | USD 0,024 |
Preços sob demanda – Regiões: Europa (Paris), Ásia-Pacífico (Sydney)
Modelo da Mistral AI | Preço por 1.000 tokens de entrada | Preço por 1.000 tokens de saída |
Mistral 7B | USD 0,0002 |
USD 0,00026 |
Mixtral 8*7B | USD 0,00059 |
USD 0,00091 |
Mistral Grande | USD 0,0104 | USD 0,0312 |
Stability AI
Preços sob demanda e em lote
Os modelos de imagem oferecidos pelo Stability AI têm o preço por imagem, dependendo do número de etapas e da resolução da imagem:
Modelo do Stability AI | Resolução da imagem | Preço por imagem gerada com qualidade padrão (<=50 etapas) | Preço por imagem gerada com qualidade premium (>50 etapas) |
SDXL 0.8 |
512 x 512 ou menor |
USD 0,018 por imagem |
USD 0,036 por imagem |
Maior que 512 x 512 |
USD 0,036 por imagem |
USD 0,072 por imagem |
|
SDXL 1.0 | Até 1024 x 1024 |
USD 0,04 | USD 0,08 |
Preços para throughput provisionada:
Modelo do Stability AI | Preço por hora por unidade de modelo para compromisso de 1 mês* | Preço por hora por unidade modelo para compromisso de 6 meses* |
SDXL 1.0 |
USD 49,86 |
USD 46,18 |
*Inclui inferência para modelos de base e personalizados.
Entre em contato com sua equipe de contas ou vendas da AWS para obter mais detalhes sobre unidades de modelo.
No momento, a personalização do modelo (ajuste fino) não é compatível com os modelos Stability AI no Amazon Bedrock.
Exemplos de preço
-
AI21 Labs
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Jurrasic-2 Mid da AI21 para resumir uma entrada de 10.000 tokens de texto em uma saída de 2.000 tokens.
Custo total acumulado = 10.000 tokens/1.000 * USD 0,0125 + 2.000 tokens/1.000 * USD 0,0125 = USD 0,15
-
Amazon
Preço sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Amazon Titan Text – Lite para resumir uma entrada de 2.000 tokens de texto em uma saída de 1.000 tokens.
Custo total acumulado por hora = 2.000 tokens/1.000 * USD 0,0003 + 1.000 tokens/1.000 * USD 0,0004 = USD 0,001.
Um desenvolvedor de aplicativos faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo base Gerador de imagens do Titan para gerar 1.000 imagens de 1024 x 1024 em tamanho de qualidade padrão
Custo total acumulado = 1000 imagens * USD 0,01 por imagem = USD 10
Preços para personalização (ajuste fino e pré-treinamento contínuo)
Um desenvolvedor de aplicações personaliza um modelo Titan Image Generation usando 1.000 pares de imagem e texto. Após o treinamento, o desenvolvedor usa a throughput provisionada do modelo personalizado por uma hora para avaliar a performance desse modelo. O modelo ajustado é armazenado por um mês. Após a avaliação, o desenvolvedor usa a throughput provisionada (compromisso de 1 mês) para hospedar o modelo personalizado.
O custo mensal do ajuste fino é: treinamento de ajuste fino (USD 0,005 * 500 * 64), em que USD 0,005 é o preço por imagem vista, 500 é o número de etapas e 64 é o tamanho do lote + armazenamento de modelo personalizado por mês (USD 1,95) + uma hora de inferência de modelo personalizado (USD 21) = USD 160 + USD 1,95 + USD 21 = USD 182,95
Preços para throughput provisionada
Um desenvolvedor de aplicações compra duas unidades de modelo do Titan Text Express com um compromisso de 1 mês para seu caso de uso de resumo de texto.
Custo mensal total acumulado = 2 unidades do modelo * USD 18,40/hora * 24 horas * 31 dias = USD 27.379,20
Um desenvolvedor de aplicações compra uma unidade do modelo base Gerador de imagens do Titan com compromisso de 1 mês.
Custo total acumulado = 1 * USD 16,20 * 24 horas * 31 dias = USD 12.052,80
-
Anthropic
Preço sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock na região Oeste dos EUA (Oregon): uma solicitação ao modelo Claude da Anthropic para resumir uma entrada de 11.000 mil de texto de entrada em uma saída de 4.000 tokens.
O custo total acumulado é de 11.000 tokens/1.000 * USD 0,008 + 4.000 tokens/1.000 * USD 0,024 = USD 0,088 + USD 0,096 = USD 0,184
Preços para throughput provisionada
Um desenvolvedor de aplicações compra uma unidade de modelo do Claude Instant da Anthropic na região Oeste dos EUA (Oregon):
O custo mensal total acumulado é de 1 unidade de modelo * USD 39,60 * 24 horas * 31 dias = USD 29.462,40
-
Cohere
Preço sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Command da Cohere para resumir uma entrada de 6.000 tokens de texto de entrada em uma saída de 2.000 tokens.
O custo total incorrido é = 6.000 tokens/1.000 * USD 0,00150 + 2.000 tokens/1.000 * USD 0,0020 = USD 0,013
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Command-Light da Cohere para resumir uma entrada de 6.000 tokens de texto de entrada em uma saída de 2.000 tokens.
Custo total acumulado = 6.000 tokens/1.000 * USD 0,0003 + 2.000 tokens/1.000 * USD 0,0006 = USD 0,003
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: um solicitação ao modelo Embed em inglês ou multilíngue da Cohere para gerar incorporações para 10.000 tokens de entrada.
Custo total acumulado = 10.000 tokens/1.000 * USD 0,0001 = USD 0,001
Preços para personalização (ajuste fino)
Um desenvolvedor de aplicações personaliza um modelo Command da Cohere usando 1000 tokens de dados. Após o treinamento, ele usa a throughput provisionada do modelo personalizado por uma hora para avaliar a performance desse modelo. O modelo ajustado é armazenado por um mês. Após a avaliação, o desenvolvedor usa a throughput provisionada (compromisso de 1 mês) para hospedar o modelo personalizado.
O custo mensal do ajuste fino é: treinamento de ajuste fino (USD 0,004 * 1.000) + armazenamento de modelos personalizados por mês (USD 1,95) + uma hora de inferência de modelo personalizado (USD 49,50) = USD 55,45
Custo mensal acumulado para throughput provisionada (compromisso de 1 mês) do modelo personalizado = USD 39,60
Preços para throughput provisionada
Um desenvolvedor de aplicações compra uma unidade de modelo do Command da Cohere com um compromisso de 1 mês para seu caso de uso de resumo de texto.
O custo mensal total acumulado é de 1 unidade de modelo * USD 39,60 * 24 horas * 31 dias = USD 29.462,40
-
Meta
Preço sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Llama 2 Chat (13B) da Meta para resumir uma entrada de 2.000 tokens de texto de entrada em uma saída de 500 tokens.
Custo total acumulado = 2.000 tokens/1.000 * USD 0,00075 + 500 tokens/1.000 * USD 0,001 = USD 0,002
Preços para personalização (ajuste fino)
Um desenvolvedor de aplicações personaliza o modelo pré-treinado do Llama 2 (70B) usando 1.000 tokens de dados. Após o treinamento, ele usa a throughput provisionada do modelo personalizado por uma hora para avaliar a performance desse modelo. O modelo ajustado é armazenado por um mês. Após a avaliação, o desenvolvedor usa a throughput provisionada (compromisso de 1 mês) para hospedar o modelo personalizado.
O custo mensal do ajuste fino é: treinamento de ajuste fino (USD 0,00799 * 1.000) + armazenamento de modelos personalizados por mês (USD 1,95) + uma hora de inferência de modelo personalizado (USD 23,50) = USD 33,44
Custo mensal acumulado para throughput provisionada (compromisso de 1 mês) do modelo personalizado = USD 21,18
Preços para throughput provisionada
Um desenvolvedor de aplicações compra uma unidade de modelo do Meta Llama 2 com um compromisso de 1 mês para seu caso de uso de resumo de texto.
O custo mensal total acumulado é de 1 unidade de modelo * USD 21,20 * 24 horas * 31 dias = USD 15.772,8
-
Mistral AI
Preço sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Mistral 7B para resumir uma entrada de 2.000 tokens de texto em uma saída de 1.000 tokens.
Custo total acumulado por hora = 2.000 tokens/1.000 * USD 0,00015 + 1.000 tokens/1.000 * USD 0,0002 = USD 0,0005
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Mistral 8x7B para resumir uma entrada de 2.000 tokens de texto em uma saída de 1.000 tokens.
Custo total acumulado por hora = 2.000 tokens/1.000 * USD 0,00045 + 1.000 tokens/1.000 * USD 0,0007 = USD 0,0016
Um desenvolvedor de aplicativos faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: Uma solicitação ao modelo Mistral Large para resumir uma entrada de 2 mil tokens de texto de entrada em uma saída de 1 mil tokens.
O custo total por hora incorrido é = 2 mil tokens/1.000 * USD 0,008 + 1 mil tokens/1.000 * USD 0,024 = USD 0,04
-
Stability AI
Preço sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo SDXL para gerar uma imagem de 512 x 512 em gradações de 70 (qualidade premium)
Custo total acumulado = 1 imagem * USD 0,036 por imagem = USD 0,036
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo SDXL1.0 para gerar uma imagem de 1024 X 1024 em gradações de 70 (qualidade premium)
Custo total acumulado = 1 imagem * USD 0,08 por imagem = USD 0,08
Preços para throughput provisionada
Um desenvolvedor de aplicações compra uma unidade de modelo do SDXL1.0 com compromisso de 1 mês.
Custo total acumulado = 1 * USD 49,86 * 24 horas * 31 dias = USD 37.095,84