O Amazon Comprehend fornece um processamento de linguagem natural, detecção e redação de informações de identificação pessoal (PII), detecção de classificações e entidades personalizadas e modelagem de tópicos, oferecendo uma ampla gama de aplicações que podem analisar textos brutos e, com certas APIs, formatos de documento como PDF e Word.  

  • Processamento de linguagem natural: APIs do Amazon Comprehend para reconhecimento de entidades, análise de sentimentos, análise de sintaxe, extração de frases-chave e detecção de linguagem podem ser usadas para extrair insights de texto de linguagem natural. Essas solicitações de inferência são medidas em unidades de 100 caracteres (1 unidade = 100 caracteres), com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.
  • Informações de identificação pessoal (PII): a API detect PII encontra localizações de entidades de informações de identificação pessoal ("PII") escolhidas dentro de um documento e pode ser usada para criar versões com conteúdo removido de documentos. A API contains PII informa se um documento contém ou não as PII escolhidas. As solicitações de inferência também são medidas em unidades de 100 caracteres, com uma cobrança mínima de 1 unidades (100 caracteres) por solicitação.
  • Compreensão personalizada: as APIs de entidades e classificação personalizadas podem treinar um modelo de NLP personalizado para categorizar textos e extrair entidades personalizadas. As solicitações de inferência assíncrona são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação. Você será cobrado 3 USD por hora pelo treinamento de modelos (cobrado por segundo) e 0,50 USD por mês pelo gerenciamento de modelos personalizados. Para solicitações de inferência síncrona de Custom Classification e Entities, você provisiona um endpoint com taxa de transferência adequada. Você é cobrado desde o momento em que inicia o endpoint até ele ser excluído.
  • Modelagem de tópicos: identifica termos ou tópicos relevantes de uma coleção de documentos armazenada no Amazon S3. Ela identificará os tópicos mais comuns da coleção e os organizará em grupos; depois, mapeará os documentos pertencem a cada tópico. Você é cobrado de acordo com o tamanho total de documentos processados por trabalho. Os primeiros 100 MB são cobrados usando uma taxa fixa. Acima de 100 MB, você é cobrado por MB.
  • Você pode fazer uma estimativa de seus custos usando a calculadora de preços da AWS.
Para volumes maiores que 100 milhões de unidades por mês, entre em contato conosco para obter a definição de preço.
As solicitações de NLP são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.

Com as APIs do Amazon Comprehend, é possível processar textos brutos não estruturados e, com certas APIs, outros arquivos de texto, como documentos PDF ou Word. 

Comprehend personalizado

Entidades e classificação personalizadas
Para reconhecimento de entidades assíncronas em PDF*, Word e documentos de texto simples

As solicitações de inferência são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.

Para classificação assíncrona

As solicitações de inferência são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.

Para classificação síncrona e reconhecimento de entidades

Endpoints são cobrados em incrementos de um segundo, com um limite mínimo de 60 segundos. Você continuará sujeito a cobranças a partir do momento que iniciar o endpoint até ele ser excluído, mesmo que nenhum documento seja analisado.

Uma unidade de inferência (UI) fornece uma taxa de transferência de 100 caracteres/segundo no endpoint gerenciado. Você pode provisionar UIs adicionais para conseguir mais taxa de transferência. Será cobrado o valor de 0,0005 USD por segundo para cada UI.

3 USD por hora de treinamento de modelo

*para extrair texto de documentos PDF digitalizados, chama-se a API Amazon Textract Detect Document Text.

Modelagem de tópicos

Para os primeiros 100 MB

Para cada MB acima de 100 MB

Você é cobrado de acordo com o tamanho total de documentos processados por trabalho de modelagem de tópicos. Os primeiros 100 MB são cobrados usando uma taxa fixa. Acima de 100 MB, você é cobrado por MB.

Nível gratuito

50 mil unidades de texto (5 milhões de caracteres)

Para cada uma das nove APIs (extração de frases-chave, análise de sentimento, reconhecimento de entidades, detecção de idioma, detecção de PII, contém PII, análise sintática, detecção de evento, entidades personalizadas e classificação personalizada) por mês, a partir da data da primeira solicitação do Amazon Comprehend.

Para a Classificação personalizada e as Entidades personalizadas, não há nível gratuito para o treinamento de modelos, gerenciamento de modelos e endpoints.

5 trabalhos de até 1 MB cada

Para modelagem de tópicos

O nível gratuito do Amazon Comprehend está disponível para clientes novos e existentes da AWS por 12 meses a partir da data da primeira solicitação do Amazon Comprehend.

Definição de preço do Amazon Comprehend Medical

Com o Amazon Comprehend Medical, você paga apenas pelo que usa. Você é cobrado com base na quantidade de texto processada mensalmente. O Amazon Comprehend Medical oferece duas APIs: Medical NERe (Named Entity and Relationship Extraction) e PHId (Protected Health Information Data Extraction and Identification).

A API Medical NERe extrai entidades, relações de entidades, características de entidade e PHI. Se os clientes desejam identificar apenas PHI para proteção de dados, eles podem solicitar a API PHId. Todas as solicitações de API são medidas em unidades de 100 caracteres, com uma cobrança mínima de uma unidade (100 caracteres) por solicitação.

Nível gratuito do Amazon Comprehend Medical

O Amazon Comprehend Medical oferece um nível gratuito para 25 mil unidades de texto (2,5 milhões de caracteres) nos primeiros três meses quando você começa a usar o serviço para qualquer uma das APIs.

Exemplos de definição de preço do Amazon Comprehend

Exemplo 1 – Análise de comentários de clientes

Vamos supor que você criou um aplicativo usando o Amazon Comprehend para analisar os comentários dos clientes em sua loja online. Você recebeu 10.000 comentários de clientes com 550 caracteres cada. Você está no segundo ano de uso do serviço.

Cálculo da cobrança total:

Tamanho de cada solicitação = 550 caracteres

Número de unidades por solicitação = 6

Total de unidades: 10.000 (solicitações) x 6 (unidades por solicitação) = 60.000

Preço por unidade = 0,0001 USD

Custo total = [nº de unidades] x [custo por unidade] = 60.000 x 0,0001 USD = 6,00 USD


Exemplo 2 – Categorização de documentos por tópicos

Vamos supor que você tem um conjunto de documentos de pesquisa totalizando 240 MB de tamanho. Você quer categorizar os documentos por tópico e recomendá-los aos clientes de acordo com sua área de interesse. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito.

Cálculo da cobrança total:

Total de megabytes processados = 240

Megabytes cobrados a uma taxa fixa de 1 USD = 100

Megabytes cobrados a 0,004 USD/MB = 140 [240-100]

Custo total do trabalho = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD


Exemplo 3 – Classificação de feedback de clientes usando a API de classificação personalizada

Digamos que você queira treinar um classificador para organizar automaticamente novo comentário de clientes recebido no seu site. 10 clientes inserem comentários a cada minuto e cada comentário tem 300 caracteres. O treinamento do modelo personalizado leva uma hora e você pretende manter o modelo por um mês. Portanto, o custo do treinamento do modelo será de 3 USD e do armazenamento do modelo será de 0,5 USD pelo mês. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito.

Para classificar os comentários de forma assíncrona, você paga pelo número de caracteres em documentos. Para classificar em tempo real, você provisiona um endpoint com taxa de transferência suficiente para tratar seu caso de uso e pagar pelo tempo em que o endpoint está ativo. 

Cálculo de custo de inferência para classificação assíncrona:

Tamanho de cada solicitação por dia = 4.320.000 caracteres [300 caracteres * 10 documentos * 1.440 minutos]

Número de unidades por solicitação = 43,200 unidades [432.000 caracteres ÷ 100 caracteres por unidade]

Preço por unidade = USD 0,0005

Custo total de inferência por unidades = 21,60 USD [43.200 unidades x 0,0005 USD]

Custo total = 25,10 USD [21,60 USD de inferência + 3 USD de treinamento de modelo + 0,50 USD de armazenamento de modelo]

Cálculo de cobrança total para classificação assíncrona:

Primeiro, vamos calcular a taxa de transferência exigida. A cada minuto, estamos classificando 10 documentos, cada um com 300 caracteres. Isso equivale a:

50 caracteres por segundo [300 caracteres x 10 documentos ÷ 60 segundos]

Você precisará provisionar um endpoint com 1 unidade de inferência (UI), gerando uma taxa de transferência de 100 caracteres/segundo.

Preço por 1 UI = 0,0005 USD por segundo

Você incorrerá em custos de acordo com o tempo de ativação do endpoint de classificação em tempo real, independentemente do número de chamadas feitas.

Se estiver executando o endpoint de classificação em tempo real 12 horas por dia:

Custo total de inferência = 21,60 USD [0,0005 USD x 3600 segundos x 12 horas]

Custo total = 25,10 USD [21,60 USD de inferência + 3 USD de treinamento de modelo + 0,50 USD de armazenamento de modelo]

Note que o valor é cobrado pela taxa de transferência provisionada e pelo tempo de ativação do endpoint. Se você precisasse provisionar mais taxa de transferência, o preço seria:

Preço por 2 UIs = 0,001 USD por segundo [0,0005 USD x 2]

Preço por 3 UIs = 0,0015 USD por segundo [0,0005 USD x 3]


Exemplo 4 - Extrair entidades médicas de documentos clínicos

Vamos supor que você criou uma aplicação usando o Amazon Comprehend Medical para analisar os comentários dos clientes em sua loja online. Você tem 1.000 documentos clínicos com 2.550 caracteres cada. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito.

Cálculo da cobrança total:

Tamanho de cada solicitação = 2.550 caracteres

Número de unidades por solicitação = 26 unidades [2.550 caracteres ÷ 100 caracteres por unidade]

Total de unidades: 1.000 (solicitações) x 26 (unidades por solicitação) = 26.000

Preço por unidade = 0,01 USD

Custo total = [nº de unidades] x [custo por unidade] = 26.000 x 0,01 USD = 260,00 USD


Exemplo 5 – Analisar comentários de clientes usando a API de entidades personalizadas

Digamos que você queira treinar um modelo de entidade personalizada para extrair automaticamente termos personalizados de feedbacks de clientes que cheguem pelo seu site. O trabalho de treinamento leva 1,5 horas, e você analisar 10.000 partes de feedbacks de cliente que tem 550 caracteres cada um. Você está planejando manter esse modelo por um mês. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito.

Cálculo da cobrança total:

Tamanho de cada solicitação = 5,500,000 caracteres

Número de unidades por solicitação = 55,000 unidades [5.500.000 caracteres ÷ 100 caracteres por unidade]

Preço por unidade = USD 0,0005

Custo total das unidades = USD 27,5 [55.000 unidades x USD 0,0005]

Total de horas para treinamento do modelo = 1,5 hora

Preço por hora = USD 3

Custo total para treinamento do modelo = 4,5 USD [1,5 horas x 3 USD]

Número de meses para gerenciamento de modelos = 1 mês

Preço por mês = USD 0,50 

Custo total do gerenciamento de modelos = USD 0,50 [1 mês x USD 0,50]

Custo total = USD 37 [USD 27,5 + USD 4,5 + USD 0,50]


Exemplo 6 – Extração de eventos e das informações associadas usando Detecção de eventos

Vamos supor que você queira extrair 3 tipos de eventos de 3.000 artigos de 500 caracteres cada e está no segundo ano de uso do serviço.

Cálculo da cobrança total:

Número de caracteres processados = 1.500.000 caracteres [3.000 artigos x 500 caracteres]

Número de unidades processadas = 45.000 unidades [1.500.000 x 3 tipos de eventos ÷ 100 caracteres por unidade]

Preço por unidade = 0,003 USD

Custo total das unidades = 135 USD [45.000 unidades x 0,003 USD]


Exemplo 7 - Identificação de documentos com PII usando a API Contém PII

Vamos supor que você criou uma aplicação usando o Amazon Comprehend para analisar os comentários dos clientes em sua loja online. Você recebeu 10.000 comentários de clientes com 550 caracteres cada e precisa identificar quais documentos contêm PII para que possam ser armazenados em um local seguro. Vamos supor que você esteja no segundo ano de uso do serviço.

Cálculo da cobrança total:

Tamanho de cada solicitação = 550 caracteres

Número de unidades por solicitação = 6

Total de unidades = 60.000 [10.000 solicitações x 6 unidades por solicitação]

Preço por unidade = 0,000002 USD

Custo total = 0,12 USD [60.000 unidades x 0,000002 USD]

Exemplo 8 – Remoção de PII de documentos usando a API Detecção de PII

Vamos supor que você criou uma aplicação usando o Amazon Comprehend para analisar os comentários dos clientes em sua loja online. Você recebeu 10.000 comentários de clientes com 550 caracteres cada e precisa criar versões com conteúdo removido dos documentos antes que eles sejam arquivados. Vamos supor que você esteja no segundo ano de uso do serviço.

Cálculo da cobrança total:

Tamanho de cada solicitação = 550 caracteres

Número de unidades por solicitação = 6

Total de unidades = 60.000 [10.000 solicitações x 6 unidades por solicitação]

Preço por unidade = 0,0001 USD

Custo total = USD 6 [60.000 unidades x USD 0,0001]

Exemplo 9: Extrair entidades de aplicação de hipoteca usando a API de entidade personalizada

Digamos que você queira treinar um modelo de extração de entidades personalizadas para extrair dez entidades personalizadas de uma aplicação de hipoteca. Cem clientes se inscrevem diariamente, cada um fornecendo um documento PDF digitalizado de dez páginas contendo 2.500 caracteres por página. Com o Amazon Textract, vamos supor que precisemos extrair o texto de cada página processada antes de extrair as entidades usando a API Detect Document Text. O treinamento do modelo personalizado leva uma hora, e você pretende manter o modelo por um mês. Portanto, o custo do treinamento do modelo será de USD 3 e do armazenamento do modelo será de USD 0,50 pelo mês. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito. Para extrair entidades personalizadas de forma assíncrona, você paga pelo número de caracteres nos documentos. Para extrair entidades em tempo real, você provisiona um endpoint com taxa de transferência suficiente para tratar seu caso de uso e pagar pelo tempo em que o endpoint está ativo.

Cálculo de custo de inferência para classificação assíncrona:

Tamanho de cada solicitação por dia = 2.500.000 caracteres [100 aplicações/dia * 10 documentos * 2.500 caracteres]

Número de unidades por solicitação = 25.000 unidades [2.500.000 caracteres ÷ 100 caracteres por unidade]

Preço por unidade = USD 0,0005

Custo total de inferência por unidades = USD 12,50 [25.000 unidades x USD 0,0005]

Custo do Amazon Textract para a API Detect Document Text = USD 1,50 [100 aplicações/dia * 10 documentos * USD 0,0015 preço por página, até 1 milhão de páginas]

Custo total = USD 17,50 [USD 12,50 de inferência + USD 1.50 de Textract + USD 3 de treinamento do modelo + USD 0,50 de armazenamento de modelo]

 

Saiba mais sobre os recursos do Amazon Comprehend

Acesse a página de recursos
Pronto para começar?
Cadastrar-se
Tem outras dúvidas?
Entre em contato conosco