O Amazon Comprehend fornece um processamento de linguagem natural, detecção e redação de informações de identificação pessoal (PII), detecção de classificações e entidades personalizadas e modelagem de tópicos, oferecendo uma ampla gama de aplicações que podem analisar textos brutos e, com certas APIs, formatos de documento como PDF e Word.

  • Processamento de linguagem natural: APIs do Amazon Comprehend para reconhecimento de entidades, análise de sentimentos, análise de sintaxe, extração de frases-chave e detecção de linguagem podem ser usadas para extrair insights de texto de linguagem natural. Essas solicitações de inferência são medidas em unidades de 100 caracteres (1 unidade = 100 caracteres), com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.
  • Informações de identificação pessoal (PII): a API de detecção PII encontra localizações de entidades de informações de identificação pessoal ("PII") escolhidas dentro de um documento e pode ser usada para criar versões com conteúdo removido de documentos. A API contém PII informa se um documento contém ou não as PII escolhidas. As solicitações também são medidas em unidades de 100 caracteres (1 unidade = 100 caracteres), com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.
  • Comprehend personalizado: as APIs de entidades e classificação personalizadas podem treinar um modelo de NLP personalizado para categorizar textos e extrair entidades personalizadas. As solicitações de inferência assíncrona são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação. Você será cobrado 3 USD por hora pelo treinamento de modelos (cobrado por segundo) e 0,50 USD por mês pelo gerenciamento de modelos personalizados. Para solicitações de inferência síncrona de Custom Classification e Entities, você provisiona um endpoint com taxa de transferência adequada. Você é cobrado desde o momento em que inicia o endpoint até ele ser excluído.
  • Modelagem de tópicos: identifica termos ou tópicos relevantes de uma coleção de documentos armazenada no Amazon S3. Ela identificará os tópicos mais comuns da coleção e os organizará em grupos, então mapeará quais documentos pertencem a qual tópico. Você é cobrado de acordo com o tamanho total de documentos processados por trabalho. Os primeiros 100 MB são cobrados usando uma taxa fixa. Acima de 100 MB, você é cobrado por MB.
  • Confiança e segurança (novidade): a API de Detecção de toxicidade do Comprehend pode ser usada para detectar conteúdo tóxico em texto. Da mesma forma, o atributo Classificação de segurança de prompts do Comprehend pode ser usado para detectar prompts de entrada não seguros em modelos e aplicações de linguagem grande. Essas solicitações de inferência são medidas em unidades de 100 caracteres (1 unidade = 100 caracteres), com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.
  • Saiba mais sobre o preço do Amazon Comprehend Medical aqui.
  • Você pode fazer uma estimativa de seus custos usando a calculadora de preços da AWS.
  • Selecione a região Leste dos EUA (Norte da Virgínia) no seletor de regiões abaixo para ver os preços de todas as APIs

 

Para volumes maiores que 100 milhões de unidades por mês, entre em contato conosco para obter a definição de preço.
As solicitações de NLP são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.

Com as APIs do Amazon Comprehend, é possível processar textos brutos não estruturados e, com certas APIs, outros arquivos de texto, como documentos PDF ou Word. 

Comprehend personalizado

Entidades e classificação personalizadas
Para reconhecimento de entidades assíncronas em PDF*, Word e documentos de texto simples

As solicitações de inferência são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.

Para classificação assíncrona

As solicitações de inferência são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.

Para classificação síncrona e reconhecimento de entidades

Endpoints são cobrados em incrementos de um segundo, com um limite mínimo de 60 segundos. Você continuará sujeito a cobranças a partir do momento que iniciar o endpoint até ele ser excluído, mesmo que nenhum documento seja analisado.

Uma unidade de inferência (UI) fornece uma taxa de transferência de 100 caracteres/segundo no endpoint gerenciado. Você pode provisionar UIs adicionais para conseguir mais taxa de transferência. Será cobrado o valor de 0,0005 USD por segundo para cada UI.

3 USD por hora de treinamento de modelo

*para extrair texto de documentos PDF digitalizados, chama-se a API Amazon Textract Detect Document Text.

Modelagem de tópicos

Para os primeiros 100 MB

Para cada MB acima de 100 MB

Você é cobrado de acordo com o tamanho total de documentos processados por trabalho de modelagem de tópicos. Os primeiros 100 MB são cobrados usando uma taxa fixa. Acima de 100 MB, você é cobrado por MB.

Nível gratuito

50 MIL UNIDADES DE TEXTO (5 MILHÕES DE CARACTERES)

O Amazon Comprehend oferece um nível gratuito que abrange 50 mil unidades de texto (5 milhões de caracteres) por API por mês.

As APIs elegíveis incluem Extração de frases-chave, Sentimento, Sentimento direcionado, Reconhecimento de entidades, Detecção de linguagem, Detecção de eventos, Análise de sintaxe, Detecção de PII, Contém PII e Classificação de segurança de prompts.

Obs.: o Comprehend personalizado (entidades personalizadas e classificação personalizada) não oferece um nível gratuito. Estão incluídos treinamento do modelo, inferência e gerenciamento do modelo.

5 TRABALHOS DE ATÉ 1 MB CADA (modelagem de tópicos)

O nível gratuito do Amazon Comprehend está disponível para clientes novos e existentes da AWS por 12 meses a partir da data da primeira solicitação do Amazon Comprehend.

Exemplos de preço do Amazon Comprehend

Exemplo 1 – Análise de comentários de clientes

Vamos supor que você criou um aplicativo usando o Amazon Comprehend para analisar os comentários dos clientes em sua loja online. Você recebeu 10.000 comentários de clientes com 550 caracteres cada. Você está no segundo ano de uso do serviço.

Cálculo da cobrança total:

Tamanho de cada solicitação = 550 caracteres

Número de unidades por solicitação = 6

Total de unidades: 10.000 (solicitações) x 6 (unidades por solicitação) = 60.000

Preço por unidade = 0,0001 USD

Custo total = [nº de unidades] x [custo por unidade] = 60.000 x 0,0001 USD = 6,00 USD


Exemplo 2 – Categorização de documentos por tópicos

Vamos supor que você tem um conjunto de documentos de pesquisa totalizando 240 MB de tamanho. Você quer categorizar os documentos por tópico e recomendá-los aos clientes de acordo com sua área de interesse. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito.

Cálculo da cobrança total:

Total de megabytes processados = 240

Megabytes cobrados a uma taxa fixa de 1 USD = 100

Megabytes cobrados a 0,004 USD/MB = 140 [240-100]

Custo total do trabalho = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD


Exemplo 3 – Classificação de feedback de clientes usando a API de classificação personalizada

Digamos que você queira treinar um classificador para organizar automaticamente novo comentário de clientes recebido no seu site. 10 clientes inserem comentários a cada minuto e cada comentário tem 300 caracteres. O treinamento do modelo personalizado leva uma hora e você pretende manter o modelo por um mês. Portanto, o custo do treinamento do modelo será de 3 USD e do armazenamento do modelo será de 0,5 USD pelo mês. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito. 

Para classificar os comentários de forma assíncrona, você paga pelo número de caracteres em documentos. Para classificar em tempo real, você provisiona um endpoint com taxa de transferência suficiente para tratar seu caso de uso e pagar pelo tempo em que o endpoint está ativo.

Cálculo de custo de inferência para classificação assíncrona:

Tamanho de cada solicitação por dia = 4.320.000 caracteres [300 caracteres * 10 documentos * 1.440 minutos]

Número de unidades por solicitação = 43,200 unidades [432.000 caracteres ÷ 100 caracteres por unidade]

Preço por unidade = USD 0,0005

Custo total de inferência por unidades = 21,60 USD [43.200 unidades x 0,0005 USD]

Custo total = 25,10 USD [21,60 USD de inferência + 3 USD de treinamento de modelo + 0,50 USD de armazenamento de modelo]

Cálculo de cobrança total para classificação assíncrona:

Primeiro, vamos calcular a taxa de transferência exigida. A cada minuto, estamos classificando 10 documentos, cada um com 300 caracteres. Isso equivale a:

50 caracteres por segundo [300 caracteres x 10 documentos ÷ 60 segundos]

Você precisará provisionar um endpoint com 1 unidade de inferência (UI), gerando uma taxa de transferência de 100 caracteres/segundo.

Preço por 1 UI = 0,0005 USD por segundo

Você incorrerá em custos de acordo com o tempo de ativação do endpoint de classificação em tempo real, independentemente do número de chamadas feitas.

Se estiver executando o endpoint de classificação em tempo real 12 horas por dia:

Custo total de inferência = 21,60 USD [0,0005 USD x 3600 segundos x 12 horas]

Custo total = 25,10 USD [21,60 USD de inferência + 3 USD de treinamento de modelo + 0,50 USD de armazenamento de modelo]

Note que o valor é cobrado pela taxa de transferência provisionada e pelo tempo de ativação do endpoint. Se você precisasse provisionar mais taxa de transferência, o preço seria:

Preço por 2 UIs = 0,001 USD por segundo [0,0005 USD x 2]

Preço por 3 UIs = USD 0,0015 por segundo [USD 0,0005 x 3]


Exemplo 4: Análise de comentários de clientes usando a API de entidades personalizadas

Digamos que você queira treinar um modelo de entidade personalizada para extrair automaticamente termos personalizados de feedbacks de clientes que cheguem pelo seu site. O trabalho de treinamento leva 1,5 horas, e você analisar 10.000 partes de feedbacks de cliente que tem 550 caracteres cada um. Você está planejando manter esse modelo por um mês. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito.

Cálculo da cobrança total:

Tamanho de cada solicitação = 5,500,000 caracteres

Número de unidades por solicitação = 55,000 unidades [5.500.000 caracteres ÷ 100 caracteres por unidade]

Preço por unidade = USD 0,0005

Custo total das unidades = USD 27,5 [55.000 unidades x USD 0,0005]

Total de horas para treinamento do modelo = 1,5 hora

Preço por hora = USD 3

Custo total para treinamento do modelo = 4,5 USD [1,5 horas x 3 USD]

Número de meses para gerenciamento de modelos = 1 mês

Preço por mês = USD 0,50 

Custo total do gerenciamento de modelos = USD 0,50 [1 mês x USD 0,50]

Custo total = USD 37 [USD 27,5 + USD 4,5 + USD 0,50]


Exemplo 5: Extração de eventos e das informações associadas usando a Detecção de eventos

Vamos supor que você queira extrair 3 tipos de eventos de 3.000 artigos de 500 caracteres cada e está no segundo ano de uso do serviço.

Cálculo da cobrança total:

Número de caracteres processados = 1.500.000 caracteres [3.000 artigos x 500 caracteres]

Número de unidades processadas = 45.000 unidades [1.500.000 x 3 tipos de eventos ÷ 100 caracteres por unidade]

Preço por unidade = 0,003 USD

Custo total das unidades = USD 135 [45.000 unidades x USD 0,003]


Exemplo 6: Identificação de documentos com PII usando a API Contém PII

Vamos supor que você criou uma aplicação usando o Amazon Comprehend para analisar os comentários dos clientes em sua loja online. Você recebeu 10.000 comentários de clientes com 550 caracteres cada e precisa identificar quais documentos contêm PII para que possam ser armazenados em um local seguro. Vamos supor que você esteja no segundo ano de uso do serviço.

Cálculo da cobrança total:

Tamanho de cada solicitação = 550 caracteres

Número de unidades por solicitação = 6

Total de unidades = 60.000 [10.000 solicitações x 6 unidades por solicitação]

Preço por unidade = 0,000002 USD

Custo total = USD 0,12 [60.000 unidades x USD 0,000002]


Exemplo 7: Remoção de PII de documentos usando a API Detecção de PII

Vamos supor que você criou uma aplicação usando o Amazon Comprehend para analisar os comentários dos clientes em sua loja online. Você recebeu 10.000 comentários de clientes com 550 caracteres cada e precisa criar versões com conteúdo removido dos documentos antes que eles sejam arquivados. Vamos supor que você esteja no segundo ano de uso do serviço.

Cálculo da cobrança total:

Tamanho de cada solicitação = 550 caracteres

Número de unidades por solicitação = 6

Total de unidades = 60.000 [10.000 solicitações x 6 unidades por solicitação]

Preço por unidade = 0,0001 USD

Custo total = USD 6 [60.000 unidades x USD 0,0001]

Exemplo 8: Extração de entidades de aplicação de hipoteca usando a API de entidade personalizada

Digamos que você queira treinar um modelo de extração de entidades personalizadas para extrair dez entidades personalizadas de uma aplicação de hipoteca. Cem clientes se inscrevem diariamente, cada um fornecendo um documento PDF digitalizado de dez páginas contendo 2.500 caracteres por página. Com o Amazon Textract, vamos supor que precisemos extrair o texto de cada página processada antes de extrair as entidades usando a API Detect Document Text. O treinamento do modelo personalizado leva uma hora, e você pretende manter o modelo por um mês. Portanto, o custo do treinamento do modelo será de USD 3 e do armazenamento do modelo será de USD 0,50 pelo mês. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito. Para extrair entidades personalizadas de forma assíncrona, você paga pelo número de caracteres nos documentos. Para extrair entidades em tempo real, você provisiona um endpoint com taxa de transferência suficiente para tratar seu caso de uso e pagar pelo tempo em que o endpoint está ativo.

Cálculo de custo de inferência para classificação assíncrona:

Tamanho de cada solicitação por dia = 2.500.000 caracteres [100 aplicações/dia * 10 documentos * 2.500 caracteres]

Número de unidades por solicitação = 25.000 unidades [2.500.000 caracteres ÷ 100 caracteres por unidade]

Preço por unidade = USD 0,0005

Custo total de inferência por unidades = USD 12,50 [25.000 unidades x USD 0,0005]

Custo do Amazon Textract para a API Detect Document Text = USD 1,50 [100 aplicações/dia * 10 documentos * USD 0,0015 preço por página, até 1 milhão de páginas]

Custo total = USD 17,50 [USD 12,50 de inferência + USD 1.50 de Textract + USD 3 de treinamento do modelo + USD 0,50 de armazenamento de modelo]

 

Exemplo 9: analisar respostas de pesquisa com funcionários

Digamos que você criou uma aplicação usando o Amazon Comprehend Targeted Sentiment para analisar as respostas da pesquisa de funcionários para sua corporação. Você recebeu 100 mil respostas de pesquisa com 350 caracteres cada e está no segundo ano de uso do serviço.

Cálculo da cobrança total:

Tamanho de cada solicitação = 350 caracteres

Número de unidades por solicitação = 4

Total de unidades: 100.000 (solicitações) x 4 (unidades por solicitação) = 400.000

Preço por unidade = USD 0,0001 (de 0-10M unidades)

Custo total = [n.º de unidades] x [custo por unidade] = 400.000 x USD 0,0001 = USD 40,00

 

Exemplo 10: Detecção de toxicidade em comentários online de sites

Vamos supor que você tenha criado uma aplicação usando o Amazon Comprehend para detectar toxicidade em comentários no seu site. Você recebeu 100 milhões de comentários de clientes com 100 caracteres cada e precisa identificar quais comentários são tóxicos por natureza e devem ser ocultados. Vamos supor que você esteja no segundo ano de uso do serviço.

            Cálculo da cobrança total:

            Tamanho de cada solicitação = 100 caracteres

            Número de unidades por solicitação = 1 total

            Unidades = 100 milhões de IUs [100 milhões de comentários x 1 unidade por solicitação]

            Preço por unidade = USD 0,0001 [de 0 a 10 milhões de IUs] + USD 0,00005 [de 10 milhões a 50 milhões de IUs] + USD 0,000025 [de 50 milhões a 100 milhões de IUs]

            Custo total = [nº de unidades] x [custo por unidade]

            = [10MXUSD 0,001]+[40MXUSD 0,00005]+[50MXUSD 0,000025]

            = USD 1.000 + USD 2.000 + USD 1.250

            = USD 4.250

Exemplo 11: Detecção de prompts não seguros em uma aplicação de IA generativa

Suponhamos que você tenha criado uma aplicação usando o Amazon Comprehend para detectar prompts de entrada não seguro quando seus usuários interagem com seu produto de IA generativa. Você recebeu 10 milhões de prompts de entrada com 500 caracteres cada e precisa identificar quais deles não são seguros. Vamos supor que você esteja no segundo ano de uso do serviço.

            Cálculo da cobrança total:

            Tamanho de cada solicitação = 500 caracteres

            Número de unidades por solicitação = 5

            Total de unidades = 50 milhões de IUs [10 milhões de comentários x 5 unidades por solicitação]

            Preço por unidade = USD 0,0001 [de 0 a 10 milhões de IUs] + USD 0,00005 [de 10 milhões a 50 milhões de IUs] + USD 0,000025 [de 50 milhões a 100 milhões de IUs]

            Custo total = [nº de unidades] x [custo por unidade]

            = [10M X USD 0.001]+[40M X USD 0,00005]

            = USD 1.000 + USD 2.000

            = USD 3.000

Saiba mais sobre os atributos do Amazon Comprehend

Acesse a página de recursos
Pronto para começar?
Cadastrar-se
Tem outras dúvidas?
Entre em contato conosco