Preços do Amazon Bedrock

Visão geral da definição de preço

O Amazon Bedrock é um serviço totalmente gerenciado que oferece uma variedade de modelos de base (FMs) de alta performance por meio de uma única API, juntamente com um amplo conjunto de recursos necessários para criar aplicações de IA generativa com segurança, privacidade e IA responsável.

Com o Amazon Bedrock, a cobrança é feita com base na inferência e na personalização de modelos. Você pode escolher entre dois planos de preços para inferência: 1. Sob demanda e em lote: esse modo permite que você use FMs com base no pagamento conforme o uso, sem precisar assumir nenhum compromisso de prazo com base no tempo. 2. Throughput provisionada: esse modo permite provisionar uma throughput suficiente para atender aos requisitos de performance da sua aplicação em troca de um compromisso de prazo baseado em tempo.

Modelos de preços

Sob demanda

Com o modo sob demanda, você paga apenas pelo que usa, sem compromissos de prazo baseados em tempo. Para modelos de geração de texto, você é cobrado por cada token de entrada processado e por cada token de saída gerado. Para modelos de incorporação, você é cobrado por cada token de entrada processado. Um token é composto por alguns caracteres e se refere à unidade básica de texto que um modelo aprende para entender a entrada e a solicitação do usuário. Para modelos de geração de imagem, você é cobrado por cada imagem gerada.

Lote

Com o modo em lote, você pode fornecer um conjunto de solicitações como um único arquivo de entrada e receber respostas como um único arquivo de saída, permitindo que você obtenha previsões simultâneas em grande escala. As respostas são processadas e armazenadas em seu bucket do Amazon S3 para que você possa acessá-las posteriormente. O preço do modo em lote é o mesmo do modo sob demanda.

Throughput provisionado

Com o modo de throughput provisionado, você pode comprar unidades de modelo para um modelo de base específico ou personalizado. O modo de throughput provisionado foi projetado principalmente para grandes workloads de inferência consistentes que precisam de throughput garantido. Modelos personalizados só podem ser acessados usando throughput provisionado. Uma unidade modelo fornece uma determinado throughput, que é medida pelo número máximo de tokens de entrada ou saída processados por minuto. Com o preço de throughput provisionado, você é cobrado por hora e tem a flexibilidade de escolher entre termos de compromisso de 1 mês ou de 6 meses.

Personalização de modelos

Com o Amazon Bedrock, você pode personalizar as FMs com seus dados para fornecer respostas personalizadas para tarefas específicas e seu contexto de negócios. É possível refinar os modelos com dados rotulados ou usar o pré-treinamento contínuo com dados não rotulados. Para personalizar um modelo de geração de texto, você é cobrado pelo treinamento do modelo com base no número total de tokens processados pelo modelo (número de tokens no corpus de dados de treinamento multiplicado pelo número de epochs). Para o armazenamento do modelo, a cobrança é feita por mês por modelo. Um epoch se refere a uma passagem completa pelo conjunto de dados de treinamento durante o ajuste fino ou o pré-treinamento contínuo. As inferências usando modelos personalizados são cobradas de acordo com o plano de throughput provisionado e exigem que você compre o throughput provisionado. Uma unidade de modelo é disponibilizada sem termo de compromisso para inferência em um modelo personalizado. Você será cobrado pelo número de horas da primeira unidade de modelo usada para inferência de modelo personalizado. Se desejar aumentar seu throughput para além de uma unidade modelo, deverá adquirir um termo de compromisso de 1 mês ou de 6 meses.

Avaliação do modelo

Com a avaliação do modelo no Amazon Bedrock, você paga pelo que usa, sem comprometer o volume no número de solicitações ou respostas. Para avaliação automática, você paga apenas pela inferência da sua escolha de modelo na avaliação. As pontuações algorítmicas geradas automaticamente são fornecidas sem custo adicional. Na avaliação baseada em humanos, na qual você traz sua própria equipe de trabalho, você é cobrado pela inferência do modelo na avaliação e uma taxa de USD 0,21 por tarefa humana concluída. Uma tarefa humana é definida como uma instância de um trabalhador humano enviando uma avaliação de um único prompt e suas respostas de inferência associadas na interface do usuário de avaliação humana. O preço será o mesmo se você tiver um ou dois modelos em seu trabalho de avaliação e continuará sendo o mesmo independentemente de quantas métricas de avaliação e métodos de classificação você incluir. As cobranças pelas tarefas humanas aparecerão na seção Amazon SageMaker em sua fatura da AWS e serão as mesmas para todas as regiões da AWS. Não há cobrança separada para mão de obra, pois ela é fornecida por você. Para uma avaliação gerenciada pela AWS, os preços são personalizados para suas necessidades de avaliação em um contrato privado enquanto trabalha com a equipe de avaliações de especialistas da AWS.

Ferramentas de criação poderosas sem custo adicional

Ao usar Atendentes do Amazon Bedrock e bases de conhecimento do Amazon Bedrock, você só é cobrado pelos modelos e bancos de dados de vetores que você usa com esses recursos.

Detalhamento de preços

O preço depende da modalidade, do fornecedor e do modelo. Selecione o fornecedor do modelo para ver os preços detalhados.

AI21 Labs

Preços sob demanda e em lote

Modelos do AI21 Labs	Preço por 1.000 tokens de entrada	Preço por 1.000 tokens de saída
Jurassic-2 Mid	USD 0,0125	USD 0,0125
Jurassic-2 Ultra	USD 0,0188	USD 0,0188

Amazon

Região

Anthropic

Preços sob demanda e em lote

Região: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)

Modelos da Anthropic	Preço por 1.000 tokens de entrada	Preço por 1.000 tokens de saída
Claude Instant	USD 0,0008	USD 0,0024
Claude 2.0/2.1	USD 0,008	USD 0,024
Claude 3 Opus*	USD 0,015	USD 0,075
Claude 3 Sonnet	USD 0,003	USD 0,015
Claude 3 Haiku	USD 0,00025	USD 0,00125
*O Claude 3 Opus está disponível na região Oeste dos EUA (Oregon) no momento

Região: Ásia-Pacífico (Sydney)

Modelos da Anthropic	Preço por 1.000 tokens de entrada	Preço por 1.000 tokens de saída
Claude 3 Sonnet	USD 0,003	USD 0,015
Claude 3 Haiku	USD 0,00025	USD 0,00125

Região da AWS: Europa (Paris)

Modelos da Anthropic	Preço por 1.000 tokens de entrada	Preço por 1.000 tokens de saída
Claude 3 Sonnet	USD 0,003	USD 0,015
Claude 3 Haiku	USD 0,00025	USD 0,00125

Região: Ásia-Pacífico (Tóquio)

Modelos da Anthropic	Preço por 1.000 tokens de entrada	Preço por 1.000 tokens de saída
Claude Instant	USD 0,0008	USD 0,0024
Claude 2.0/2.1	USD 0,008	USD 0,024

Região: Europa (Frankfurt)

Modelos da Anthropic	Preço por 1.000 tokens de entrada	Preço por 1.000 tokens de saída
Claude Instant	USD 0,0008	USD 0,0024
Claude 2.0/2.1	USD 0,008	USD 0,024

Preços para throughput provisionado

Região: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)

Modelos da Anthropic	Preço por hora por modelo sem compromisso	Preço por hora por unidade de modelo para compromisso de 1 mês	Preço por hora por unidade modelo para compromisso de 6 meses
Claude Instant	USD 44,00	USD 39,60	USD 22,00
Claude 2.0/2.1	USD 70,00	USD 63,00	USD 35,00

Modelos da Anthropic	Preço por hora por modelo sem compromisso	Preço por hora por unidade de modelo para compromisso de 1 mês	Preço por hora por unidade modelo para compromisso de 6 meses
Claude Instant	USD 44,00	USD 39,60	USD 22,00
Claude 2.0/2.1	USD 70,00	USD 63,00	USD 35,00

Região: Ásia-Pacífico (Tóquio)

Modelos da Anthropic	Preço por hora por unidade de modelo para compromisso de 1 mês	Preço por hora por unidade modelo para compromisso de 6 meses
Claude Instant	USD 53,00	USD 29,00
Claude 2.0/2.1	USD 86,00	USD 48,00

Região: Europa (Frankfurt)

Modelos da Anthropic	Preço por hora por unidade de modelo para compromisso de 1 mês	Preço por hora por unidade modelo para compromisso de 6 meses
Claude Instant	USD 49,00	USD 27,00
Claude 2.0/2.1	USD 79,00	USD 44,00

Entre em contato com sua equipe de contas da AWS para obter mais detalhes sobre unidades de modelo.

Cohere

Preços sob demanda e em lote

Modelos do Cohere	Preço por 1.000 tokens de entrada	Preço por 1.000 tokens de saída
Command	USD 0,0015	USD 0.0020
Command-Light	USD 0,0003	USD 0,0006
Command R+	USD 0,0030	USD 0,0150
Command R	USD 0,0005	USD 0,0015
Embed – Inglês	USD 0,0001	N/A
Embed – Multilíngue	USD 0,0001	N/A

Preços para personalização (ajuste fino)

Modelos do Cohere	Preço para treinar 1.000 tokens	Preço para armazenar cada modelo personalizado por mês	Preço a ser inferido de um modelo personalizado por unidade de modelo por hora (com preços de throughput provisionado sem compromisso)
Cohere Command	USD 0,004	USD 1,95	USD 49,50
Cohere Command-Light	USD 0,001	USD 1,95	USD 8,56

*Total de tokens treinados = número de tokens no corpus de dados de treinamento x número de epochs

Preços para throughput provisionado

Modelos do Cohere	Preço por hora por modelo sem compromisso	Preço por hora por unidade de modelo para compromisso de 1 mês	Preço por hora por unidade modelo para compromisso de 6 meses
Cohere Command	USD 49,50	USD 39,60	USD 23,77
Cohere Command - Light	USD 8,56	USD 6,85	USD 4,11
Embed – Inglês	USD 7,12	USD 6,76	USD 6,41
Embed – Multilíngue	USD 7,12	USD 6,76	USD 6,41

Entre em contato com sua equipe de contas ou vendas da AWS para obter mais detalhes sobre unidades de modelo.

Meta Llama

Preços sob demanda e em lote

Modelos do Meta	Preço por 1.000 tokens de entrada	Preço por 1.000 tokens de saída
Llama 2 Chat (13B)	USD 0,00075	USD 0,001
Llama 2 Chat (70B)	USD 0,00195	USD 0,00256
Lhama 3 Instruct (8B)	USD 0,0004	USD 0,0006
Lhama 3 Instruct (70B)	USD 0,00265	USD 0,0035

Preços para personalização de modelos (ajuste fino)

Modelos do Meta	Preço para treinar 1.000 tokens	*Preço para armazenar cada modelo personalizado por mês**	Preço a ser inferido de um modelo personalizado para 1 unidade de modelo por hora (com preços de throughput provisionado sem compromisso)
Llama 2 pré-treinado (13B)	USD 0,00149	USD 1,95	USD 23,50
Llama 2 pré-treinado (70B)	USD 0,00799	USD 1,95	USD 23,50

*Armazenamento de modelo personalizado = USD 1,95

Preços para throughput provisionado

Modelos do Meta	Preço por hora por unidade de modelo para compromisso de 1 mês	Preço por hora por unidade modelo para compromisso de 6 meses
Llama 2 pré-treinado e Chat (13B)	USD 21,18	USD 13,08
Llama 2 pré-treinado (70B)	USD 21,18	USD 13,08

*Os modelos pré-treinados do Llama 2 estão disponíveis somente em throughput provisionado após a personalização.

Entre em contato com sua equipe de contas ou vendas da AWS para obter mais detalhes sobre unidades de modelo.

Mistral AI

Região

Stability AI

Preços sob demanda e em lote

Os modelos de imagem oferecidos pelo Stability AI são precificados por imagem, dependendo do número de etapas e da resolução da imagem:

Modelo do Stability AI	Resolução da imagem	Preço por imagem gerada com qualidade padrão (<=50 etapas)	Preço por imagem gerada com qualidade premium (>50 etapas)
SDXL 0.8	512 x 512 ou menor	USD 0,018 por imagem	USD 0,036 por imagem
SDXL 0.8	Maior que 512 x 512	USD 0,036 por imagem	USD 0,072 por imagem
SDXL 1.0	Até 1024 x 1024	USD 0,04	USD 0,08

Preços para throughput provisionado

Modelo do Stability AI	Preço por hora por unidade de modelo para compromisso de 1 mês*	Preço por hora por unidade modelo para compromisso de 6 meses*
SDXL 1.0	USD 49,86	USD 46,18

*Inclui inferência para modelos de base e personalizados

Entre em contato com sua equipe de contas ou vendas da AWS para obter mais detalhes sobre unidades de modelo.

No momento, a personalização de modelos (ajuste fino) não é compatível com os modelos do Stability AI no Amazon Bedrock.

Barreiras de proteção para Amazon Bedrock

Preços sob demanda

Política de guardrail*	Preço por 1.000 unidades de texto**
Filtros de conteúdo	USD 0,75
Tópicos negados	USD 1
Filtro de informações confidenciais (PII)	USD 0,10
Filtro de informações confidenciais (expressão regular)	Grátis
Filtros de palavras	Grátis

* Cada política de barreira de proteção é opcional e pode ser habilitada com base nos requisitos da aplicação. As cobranças serão feitas com base no tipo de política usado na barreira de proteção. Por exemplo, se uma barreira de proteção estiver configurada com filtros de conteúdo e tópicos negados, haverá cobranças por essas duas políticas, mas não haverá cobranças associadas aos filtros de informações confidenciais.

**Uma unidade de texto pode conter até 1000 caracteres. Se uma entrada de texto tiver mais de 1000 caracteres, ela será processada como várias unidades de texto, cada uma contendo 1000 caracteres ou menos. Por exemplo, se uma entrada de texto contiver 5600 caracteres, ela será cobrada como 6 unidades de texto.

Não há suporte a barreiras de proteção para imagens e incorporações.

Exemplos de preços

AI21 Labs

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Jurrasic-2 Mid da AI21 para resumir uma entrada de 10.000 tokens de texto em uma saída de 2.000 tokens.

Custo total acumulado = 10.000 tokens/1000 * USD 0,0125 + 2.000 tokens/1000 * USD 0,0125 = USD 0,15
Amazon

Preços sob demanda

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Amazon Titan Text Lite para resumir uma entrada de 2.000 tokens de texto em uma saída de 1.000 tokens.

Custo total acumulado por hora = 2.000 tokens/1.000 * USD 0,0003 + 1.000 tokens/1.000 * USD 0,0004 = USD 0,001.

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo de base do Gerador de imagens do Amazon Titan para gerar 1000 imagens de 1024 x 1024 em tamanho de qualidade padrão.

Custo total acumulado = 1000 imagens * USD 0,01 por imagem = USD 10

Preços para personalização (ajuste fino e pré-treinamento contínuo)

Um desenvolvedor de aplicações personaliza um modelo Gerador de imagens do Amazon Titan usando 1.000 pares de imagem e texto. Após o treinamento, o desenvolvedor usa o throughput provisionado do modelo personalizado por 1 hora para avaliar a performance desse modelo. O modelo ajustado é armazenado por 1 mês. Após a avaliação, o desenvolvedor usa o throughput provisionado (compromisso de 1 mês) para hospedar o modelo personalizado.

Custo mensal do ajuste fino = treinamento de ajuste fino (USD 0,005 * 500 * 64), em que USD 0,005 é o preço por imagem vista, 500 é o número de etapas e 64 é o tamanho do lote + armazenamento de modelo personalizado por mês (USD 1,95) + 1 hora de inferência de modelo personalizado (USD 21) = USD 160 + USD 1,95 + USD 21 = USD 182,95

Preços para throughput provisionado

Um desenvolvedor de aplicações compra duas unidades de modelo do Amazon Titan Text Express com um compromisso de 1 mês para seu caso de uso de resumo de texto.

Custo mensal total acumulado = 2 unidades do modelo * USD 18,40/hora * 24 horas * 31 dias = USD 27.379,20

Um desenvolvedor de aplicações compra uma unidade de modelo do modelo de base do Gerador de imagens do Amazon Titan com compromisso de 1 mês.

Custo total incorrido = 1 unidade do modelo * USD 16,20 * 24 horas* 31 dias = USD 12.052,80
Anthropic

Preços sob demanda

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock na região Oeste dos EUA (Oregon): uma solicitação ao modelo Claude da Anthropic para resumir uma entrada de 11.000 tokens de texto em uma saída de 4.000 tokens.

O custo total acumulado é de 11.000 tokens/1000 * USD 0,008 + 4.000 tokens/1000 * USD 0,024 = USD 0,088 + USD 0,096 = USD 0,184

Preços para throughput provisionado

Um desenvolvedor de aplicações compra uma unidade de modelo do Claude Instant da Anthropic na região Oeste dos EUA (Oregon):

O custo mensal total acumulado é de 1 unidade de modelo * USD 39,60 * 24 horas * 31 dias = USD 29.462,40
Cohere

Preços sob demanda

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Command da Cohere para resumir uma entrada de 6.000 tokens de texto em uma saída de 2.000 tokens.

O custo total incorrido é = 6.000 tokens/1.000 * USD 0,0015 + 2.000 tokens/1.000 * USD 0,0020 = USD 0,013

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Command-Light da Cohere para resumir uma entrada de 6.000 tokens de texto de entrada em uma saída de 2.000 tokens.

Custo total acumulado = 6.000 tokens/1000 * USD 0,0003 + 2.000 tokens/1000 * USD 0,0006 = USD 0,003

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: um solicitação ao modelo Embed em inglês ou Embed multilíngue da Cohere para gerar incorporações para 10.000 tokens de entrada.

Custo total acumulado = 10.000 tokens/1000 * USD 0,0001 = USD 0,001

Preços para personalização (ajuste fino)

Um desenvolvedor de aplicações personaliza um modelo Command da Cohere usando 1000 tokens de dados. Após o treinamento, ele usa o throughput provisionado do modelo personalizado por 1 hora para avaliar a performance desse modelo. O modelo ajustado é armazenado por 1 mês. Após a avaliação, o desenvolvedor usa o throughput provisionado (compromisso de 1 mês) para hospedar o modelo personalizado.

O custo mensal do ajuste fino é: treinamento de ajuste fino (USD 0,004 * 1000) + armazenamento de modelos personalizados por mês (USD 1,95) + 1 hora de inferência de modelo personalizado (USD 49,50) = USD 55,45

Custo mensal acumulado para throughput provisionado (compromisso de 1 mês) do modelo personalizado = USD 39,60

Preços para throughput provisionado

Um desenvolvedor de aplicações compra uma unidade de modelo do Command da Cohere com um compromisso de 1 mês para seu caso de uso de resumo de texto.

O custo mensal total acumulado é de 1 unidade de modelo * USD 39,60 * 24 horas * 31 dias = USD 29.462,40
Meta Llama

Preços sob demanda

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Llama 2 Chat (13B) da Meta para resumir uma entrada de 2.000 tokens de texto de entrada em uma saída de 500 tokens.

Custo total acumulado = 2.000 tokens/1000 * USD 0,00075 + 500 tokens/1000 * USD 0,001 = USD 0,002

Preços para personalização (ajuste fino)

Um desenvolvedor de aplicações personaliza o modelo pré-treinado do Llama 2 (70B) usando 1000 tokens de dados. Após o treinamento, ele usa o throughput provisionado do modelo personalizado por 1 hora para avaliar a performance desse modelo. O modelo ajustado é armazenado por 1 mês. Após a avaliação, o desenvolvedor usa o throughput provisionado (compromisso de 1 mês) para hospedar o modelo personalizado.

O custo mensal do ajuste fino é: treinamento de ajuste fino (USD 0,00799 * 1000) + armazenamento de modelo personalizado por mês (USD 1,95) + 1 hora de inferência de modelo personalizado (USD 23,50) = USD 33,44

Custo mensal acumulado para throughput provisionado (compromisso de 1 mês) do modelo personalizado = USD 21,18

Preços para throughput provisionado

Um desenvolvedor de aplicações compra uma unidade de modelo do Meta Llama 2 com um compromisso de 1 mês para seu caso de uso de resumo de texto.

O custo mensal total acumulado é de 1 unidade de modelo * USD 21,18 * 24 horas * 31 dias = USD 15.757,92
Mistral AI

Preços sob demanda

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Mistral 7B para resumir uma entrada de 2.000 tokens de texto em uma saída de 1.000 tokens.

Custo total acumulado por hora = 2.000 tokens/1000 * USD 0,00015 + 1000 tokens/1.000 * USD 0,0002 = USD 0,0005

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Mistral 8x7B para resumir uma entrada de 2.000 tokens de texto em uma saída de 1.000 tokens.

Custo total acumulado por hora = 2.000 tokens/1000 * USD 0,00045 + 1000 tokens/1.000 * USD 0,0007 = USD 0,0016

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Mistral Large para resumir uma entrada de 2.000 tokens de texto de entrada em uma saída de 1.000 tokens.

O custo total por hora incorrido é = 2.000 tokens/1000 * USD 0,008 + 1.000 tokens/1000 * USD 0,024 = USD 0,04
Stability AI

Preços sob demanda

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo SDXL para gerar uma imagem de 512 x 512 em gradações de 70 (qualidade premium).

Custo total acumulado = 1 imagem * USD 0,036 por imagem = USD 0,036

Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo SDXL 1.0 para gerar uma imagem de 1024 X 1024 em gradações de 70 (qualidade premium).

Custo total acumulado = 1 imagem * USD 0,08 por imagem = USD 0,08

Preços para throughput provisionado

Um desenvolvedor de aplicações compra uma unidade de modelo do SDXL 1.0 com compromisso de 1 mês.

Custo total acumulado = 1 * USD 49,86 * 24 horas * 31 dias = USD 37.095,84

Avaliação do modelo

Exemplo de avaliação de modelo 1:

O conjunto de dados contém 50 solicitações e o desenvolvedor exige que 1 pessoa avalie cada conjunto de prompts de resposta (configurável na criação do trabalho de avaliação como parâmetro “pessoas por prompt”).

Haverá 50 tarefas neste trabalho de avaliação (uma tarefa para cada conjunto de prompt-resposta por cada trabalhador). As 50 solicitações combinam até 5.000 tokens de entrada, e as respostas associadas combinam 15.000 tokens para o Anthropic Claude Instant e 20.000 tokens para o Anthropic Claude 2.1.

As seguintes cobranças são cobradas por esse trabalho de avaliação de modelo:

Item	Número de tokens de entrada	Preço por 1.000 tokens de entrada	Custo da entrada	Número de tokens de saída	Preço por 1.000 tokens de saída	Custo de produção	Número de tarefas humanas	Preço por tarefa humana	Custo das tarefas humanas	Total
Inferência instantânea de Claude	5.000	USD 0,0008	USD 0,004	15.000	USD 0,0024	USD 0,036				USD 0,04
Inferência do Claude 2.1	5.000	USD 0,008	USD 0,04	20.000	USD 0,024	USD 0,48				USD 0,52
Tarefas humanas							50	USD 0,21	USD 10,50	USD 10,50
Total										USD 11,06

Exemplo de avaliação de modelo 2:

Preços sob demanda
Um desenvolvedor de aplicações envia um conjunto de dados para avaliação de modelos baseada em humanos usando o Anthropic Claude 2.1 e o Anthropic Claude Instant na região da AWS Leste dos EUA (Norte da Virgínia).

O conjunto de dados contém 50 solicitações e o desenvolvedor exige que dois trabalhadores avaliem cada conjunto de prompts de resposta (configurável na criação do trabalho de avaliação como parâmetro “trabalhadores por prompt”). Haverá 100 tarefas neste trabalho de avaliação (1 tarefa para cada conjunto de resposta de prompt por cada trabalhador: 2 trabalhadores x 50 conjuntos de respostas de prompt = 100 tarefas humanas).

As 50 solicitações combinam até 5.000 tokens de entrada, e as respostas associadas combinam 15.000 tokens para o Anthropic Claude Instant e 20.000 tokens para o Anthropic Claude 2.1.

As seguintes cobranças são cobradas por esse trabalho de avaliação de modelo:

Item	Número de tokens de entrada	Preço por 1.000 tokens de entrada	Custo da entrada	Número de tokens de saída	Preço por 1.000 tokens de saída	Custo de produção	Número de tarefas humanas	Preço por tarefa humana	Custo das tarefas humanas	Total
Inferência instantânea de Claude	5.000	0,0008 USD	USD 0,0040	15.000	USD 0,0024	USD 0,036				USD 0,04
Inferência do Claude 2.1	5.000	USD 0,008	USD 0,0400	20.000	USD 0,024	USD 0,48				USD 0,52
Tarefas humanas							100	USD 0,21	USD 21,00	USD 21,00
Total										USD 21,56

Barreiras de proteção para Amazon Bedrock

Exemplo 1: chatbot de suporte ao cliente
Um desenvolvedor de aplicações cria um chatbot de suporte ao cliente e usa filtros de conteúdo para bloquear conteúdo nocivo e tópicos negados para filtrar consultas e respostas indesejáveis.

O chatbot atende a 1.000 consultas de usuários por hora. Cada consulta do usuário tem um tamanho médio de entrada de 200 caracteres e recebe uma resposta FM com 1.500 caracteres.

Cada consulta do usuário de 200 caracteres corresponde a 1 unidade de texto.

Cada resposta FM de 1.500 caracteres corresponde a 2 unidades de texto.

Unidades de texto processadas a cada hora = (1 + 2) * 1.000 consultas = 3.000 unidades de texto

Custo total incorrido por hora com filtros de conteúdo e tópico negado = 3.000 * (USD 0,75 + USD 1,00)/1.000 = USD 5,25

Exemplo 2: resumo de transcrição do call center
Um desenvolvedor de aplicações cria uma aplicação para resumir as transcrições de chat entre usuários e atendentes de suporte. Ele usa filtro de informações confidenciais para omitir informações de identificação pessoal (PII) nos resumos gerados para 10.000 conversas.

Cada resumo gerado tem uma média de 3.500 caracteres que correspondem a 4 unidades de texto.

Custo total incorrido para resumir 10.000 conversas = 10.000 * 4 * (0,1/1000) = USD 4

Item	Número de tokens de entrada	Preço por 1.000 tokens de entrada	Custo da entrada	Número de tokens de saída	Preço por 1.000 tokens de saída	Custo de produção	Número de tarefas humanas	Preço por tarefa humana	Custo das tarefas humanas	Total
Inferência instantânea de Claude	5.000	USD 0,0008	USD 0,004	15.000	USD 0,0024	USD 0,036				USD 0,04
Inferência do Claude 2.1	5.000	USD 0,008	USD 0,04	20.000	USD 0,024	USD 0,48				USD 0,52
Tarefas humanas							100	USD 0,21	USD 21,00	USD 21,00
Total										USD 21,56

Preços do Amazon Bedrock

Visão geral da definição de preço

Modelos de preços

Sob demanda

Lote

Throughput provisionado

Personalização de modelos

Avaliação do modelo

Ferramentas de criação poderosas sem custo adicional

Detalhamento de preços

AI21 Labs

Amazon

Anthropic

Cohere

Meta Llama

Mistral AI

Stability AI

Barreiras de proteção para Amazon Bedrock

Exemplos de preços

AI21 Labs

Amazon

Preços sob demanda

Preços para personalização (ajuste fino e pré-treinamento contínuo)

Preços para throughput provisionado

Anthropic

Preços sob demanda

Preços para throughput provisionado

Cohere

Preços sob demanda

Preços para personalização (ajuste fino)

Meta Llama

Preços sob demanda

Preços para personalização (ajuste fino)

Preços para throughput provisionado

Mistral AI

Preços sob demanda

Stability AI

Preços sob demanda

Preços para throughput provisionado

Avaliação do modelo

Exemplo de avaliação de modelo 1:

Exemplo de avaliação de modelo 2:

Barreiras de proteção para Amazon Bedrock

Encerramento do suporte para o Internet Explorer