Amazon Comprehend ofrece procesamiento de lenguaje natural, detección y redacción de información personal identificable (PII), clasificación personalizada y detección de entidades, y modelado de temas, lo que permite una amplia gama de aplicaciones que pueden analizar texto sin procesar y, con algunas API, formatos de documentos como PDF y Word.  

  • Procesamiento de lenguaje natural: las API de Amazon Comprehend para el reconocimiento de entidades, el análisis de sentimiento, el análisis sintáctico, la extracción de frases clave y la detección del idioma se pueden utilizar para extraer información del texto en lenguaje natural. Las solicitudes se miden en unidades de 100 caracteres (una unidad = 100 caracteres) con un cargo mínimo de tres unidades (300 caracteres) por solicitud.
  • Información de identificación personal (PII): la API de detección de PII encuentra las ubicaciones de las entidades de información de identificación personal (“PII”) elegidas dentro de un documento y se puede utilizar para crear versiones con partes suprimidas de los documentos. La API de PII le indica si un documento contiene o no la información de identificación personal elegida. Las solicitudes también se miden en unidades de 100 caracteres (una unidad = 100 caracteres) con un cargo mínimo de tres unidades (300 caracteres) por solicitud.
  • Comprehend personalizado: las API de clasificación y entidades personalizadas pueden entrenar un modelo de procesamiento de lenguaje natural personalizado para categorizar textos y extraer entidades personalizadas. Las solicitudes de inferencia asincrónica se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud. Se le cobrarán 3 USD por hora por el entrenamiento de modelos (se factura por segundo) y 0,50 USD por mes por la administración de modelos personalizados. Para la clasificación sincrónica personalizada y las solicitudes de inferencia de entidades, aprovisione un punto de enlace con el rendimiento adecuado. Se le aplicarán cargos desde el momento en que comienza el punto de enlace hasta que este se elimina.
  • Modelado de temas: el modelado de temas identifica los términos o temas relevantes de una colección de documentos almacenados en Amazon S3. Identifica los temas más comunes del conjunto y los organiza en grupos. A continuación, identifica qué documentos pertenecen a qué tema. Se aplicarán cargos en base al tamaño total de los documentos procesados por trabajo. Se aplica un cargo plano para los primeros 100 MB. Al superar los 100 MB, se aplica un cargo por cada MB.
  • Puede estimar los costos con la calculadora de precios de AWS.
Para los volúmenes de más de 100 millones de unidades por mes, contacte con nosotros si desea consultar los precios.
Las solicitudes de procesamiento de lenguaje natural se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.

Con las API de Amazon Comprehend, puede procesar tanto texto sin estructurar como, con algunas API, otros archivos de texto como documentos PDF y Word. 

Comprehend personalizado

Entidades y clasificación personalizadas
Para el reconocimiento asíncrono de entidades en documentos PDF*, Word y texto sin formato

Las solicitudes de inferencia se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.

Para la clasificación asíncrona

Las solicitudes de inferencia se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.

Para la clasificación sincrónica y el reconocimiento de entidades

Los puntos de enlace se facturan en incrementos de 1 segundo, por un mínimo de 60 segundos. Los cargos continuarán generándose desde el momento en que comienza el punto de enlace hasta que se elimina, incluso si no se analiza ningún documento.

Una unidad de inferencia (IU) ofrece un rendimiento de 100 caracteres por segundo en el punto de enlace administrado. Puede aprovisionar IU adicionales para un rendimiento mayor. Cada IU generará un costo de 0,0005 USD por segundo.

3 USD por hora para entrenamiento de modelos

*para extraer el texto de los documentos PDF escaneados se llama a la API de detección de texto de documentos de Amazon Textract.

Modelado de temas

Para los primeros 100 MB

Por cada MB que supere los 100 MB

Se aplicarán cargos en base al tamaño total de los documentos procesados por trabajo de modelado de tema. Para los primeros 100 MB se aplica una tarifa fija. Al superar los 100 MB, se aplica un cargo por cada MB.

Capa gratuita

50 000 unidades de texto (5 millones de caracteres)

Para cada una de las 9 API (extracción de frases claves, análisis de opiniones, reconocimiento de entidades, detección de idiomas, detección de información de identificación personal, contiene información de identificación personal, detección de eventos, análisis sintáctico, clasificación personalizada y entidades personalizadas) por mes, a partir de la fecha de la primera solicitud de Amazon Comprehend.

En el caso de la clasificación personalizada y las entidades personalizadas, no existe capa gratuita para el entrenamiento, la administración de modelos ni los puntos de enlace.

5 trabajos de hasta 1 MB cada uno

Para el modelado de temas

La capa gratuita de Amazon Comprehend está disponible para clientes nuevos y existentes de AWS durante 12 meses, a partir de la fecha de su primera solicitud de Amazon Comprehend.

Precios de Amazon Comprehend Medical

Con Amazon Comprehend Medical, paga únicamente por lo que usa. Se cobra en función de la cantidad de texto procesado mensualmente. Amazon Comprehend Medical proporciona dos API: Medical Named Entity and Relationship Extraction (NERe) y Protected Health Information Data Extraction and Identification (PHId).

La API Medical NERe extrae entidades, relaciones entre entidades, características de entidades e información sanitaria protegida (PHI, por sus siglas en inglés). Si los clientes solo quieren identificar PHI con fines de protección de datos, pueden solicitar la API PHId. Todas las solicitudes de API se miden en unidades de 100 caracteres con un cargo mínimo de una unidad (100 caracteres) por solicitud.

Capa gratuita de Amazon Comprehend Medical

Amazon Comprehend Medical ofrece una capa gratuita que cubre 25 000 unidades de texto (2,5 millones de caracteres) durante los primeros tres meses siguientes al inicio del uso del servicio para cualquiera de las API.

Ejemplos de aplicación de precios de Amazon Comprehend

Ejemplo 1 – Análisis de comentarios de clientes

Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en su tienda en línea. Ha recibido 10 000 comentarios del cliente que tienen 550 caracteres cada uno y está en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada pedido = 550 caracteres

Número de unidades por solicitud = 6

Total de unidades: 10 000 (pedidos) x 6 (unidades por pedido) = 60 000

Precio por unidad = 0,0001 USD

Costo total = [N.º de unidades] x [Costo por unidad] = 60 000 x 0,0001 USD = 6,00 USD


Ejemplo 2 – Categorización de documentos por tema

Digamos que tiene un conjunto de documentos de investigación que conforman un total de 240 MB de tamaño que quiere categorizar por tema y recomendar los documentos a sus clientes en base a sus áreas de interés. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Cálculo de cargos totales:

Total de megabytes procesados = 240

Megabytes facturados a tarifa plana de 1 USD = 100

Megabytes facturados a 0,004 USD/MB = 140 [240-100]

Costo total del trabajo = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD


Ejemplo 3 – Clasificación de comentarios de los clientes mediante la API de Clasificación personalizada

Supongamos que usted quiere entrenar un clasificador con la finalidad de organizar de manera automática los comentarios de los clientes nuevos que ingresan desde su sitio web. Cada minuto, hay 10 clientes que escriben comentarios y cada comentario contiene 300 caracteres. Lleva una hora entrenar el modelo personalizado y usted tiene pensado mantener este modelo durante un mes. Por lo tanto, el modelo de capacitación costará 3 USD y el de almacenamiento costará 0,5 USD por mes. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Para clasificar el comentario de manera asincrónica, paga por número de caracteres en sus documentos. Para clasificar en tiempo real, aprovisiona un punto de enlace con suficiente rendimiento para gestionar el caso de uso y pagar por el tiempo que el punto de enlace termina. 

Cálculo del costo de inferencia por la clasificación asincrónica:

Tamaño de cada solicitud por día = 4 320 000 caracteres [300 caracteres * 10 documentos * 1440 minutos]

Número de unidades por solicitud = 43 200 unidades [432 000 caracteres ÷ 100 caracteres por unidad]

Precio por unidad = 0,0005 USD

Costo de inferencia total por unidades = 21,60 USD [43 200 unidades x 0,0005 USD]

Costo total = 25,10 USD [21,60 USD por inferencia + 3 USD por capacitación de modelo + 0,50 USD por almacenamiento de modelo]

Cálculo de cargo total para la clasificación sincrónica:

Primero, calculemos el rendimiento requerido. Por minuto, clasificamos 10 documentos de 300 caracteres cada uno. Es decir:

50 caracteres por segundo [300 caracteres x 10 documentos ÷ 60 segundos]

Entonces, deberá aprovisionar un punto de enlace con 1 unidad de inferencia (IU), que otorga un rendimiento de 100 caracteres por segundo.

Precio por 1 IU = 0,0005 USD por segundo

Incurrirá en costos dependiendo de por cuánto tiempo mantenga activo el punto de enlace de clasificación en tiempo real, independientemente de cuántas llamadas de inferencia se realicen.

Si ejecuta el punto de enlace de clasificación en tiempo real durante 12 horas por día:

Costo de inferencia total = 21,60 USD [0,0005 USD x 3600 segundos x 12 horas]

Costo total = 25,10 USD [21,60 USD por inferencia + 3 USD por capacitación de modelo + 0,50 USD por almacenamiento de modelo]

Tenga en cuenta que incurrirá en costos por el rendimiento aprovisionado y por la cantidad de tiempo en que el punto de enlace esté activo. Si necesita aprovisionar más rendimiento, el precio será:

Precio por 2 IU = 0,001 USD por segundo [0,0005 USD x 2]

Precio por 3 IU = 0,0015 USD por segundo [0,0005 USD x 3]


Ejemplo 4 – Extracción de entidades médicas de documentos clínicos

Supongamos que ha creado una aplicación que usa Amazon Comprehend Medical para analizar los documentos clínicos en su lago de datos. Tiene 1000 documentos clínicos con 2550 caracteres cada uno. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Cálculo de cargos totales:

Tamaño de cada solicitud = 2550 caracteres

Número de unidades por solicitud = 26 unidades [2550 caracteres ÷ 100 caracteres por unidad]

Total de unidades: 1000 (solicitudes) x 26 (unidades por pedido) = 26 000

Precio por unidad = 0,01 USD

Costo total = [N.º de unidades] x [Costo por unidad] = 26 000 x 0,01 USD = 260,00 USD


Ejemplo 5 - Análisis de comentarios de clientes mediante la API de entidades personalizadas

Supongamos que desea entrenar un modelo de entidad personalizado para extraer automáticamente términos personalizados de los comentarios de los clientes que proceden de su sitio web. El trabajo de entrenamiento dura 1,5 horas y se analizan 10.000 elementos de comentarios de clientes de 550 caracteres cada uno. Planea mantener este modelo durante un mes. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Cálculo de cargos totales:

Tamaño de cada pedido = 5,500,000 caracteres

Número de unidades por solicitud = 55,000 units [5,500,000 caracteres ÷ 100 caracteres por unidad]

Precio por unidad = 0,0005 USD

Costo total por unidades = 27,5 USD [55 000 unidades x 0,0005 USD]

Total de horas para entrenamiento de modelos = 1,5 horas

Precio por hora = 3 USD

Costo total para entrenamiento de modelos = 4.5 USD [1,5 horas x 3 USD]

Número de meses para la administración de modelos = 1 mes

Precio por mes = 0,50 USD 

Costo total por la administración de modelos = 0,50 USD [1 mes x 0,50 USD]

Costo total = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]


Ejemplo 6: extracción de eventos y de la información asociada mediante la detección de eventos

Supongamos que desea extraer 3 tipos de eventos a partir de 3000 artículos de 500 caracteres cada uno y que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Número de caracteres procesados = 1 500 000 caracteres [3000 artículos x 500 caracteres]

Número de unidades procesadas = 45 000 unidades [1 500 000 x 3 tipos de eventos ÷ 100 caracteres por unidad]

Precio por unidad = 0,003 USD

Costo total por unidades = 135 USD [45 000 unidades x 0,003 USD]


Ejemplo 7: identificación de documentos con información de identificación personal (PII) mediante la API denominada contiene PII

Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en su tienda en línea. Ha recibido 10 000 comentarios de clientes de 550 caracteres cada uno. Necesita identificar qué documentos contienen información de identificación personal para poder almacenarlos en una ubicación segura. Supongamos que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada pedido = 550 caracteres

Número de unidades por solicitud = 6

Total de unidades = 60 000 [10 000 solicitudes x 6 unidades por solicitud]

Precio por unidad = 0,000002 USD

Costo total = 0,12 USD [60 000 unidades x 0,000002 USD]

Ejemplo 8. editar de modo que no aparezca información de identificación personal en los documentos mediante la API de detección de información de identificación personal

Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en su tienda en línea. Ha recibido 10 000 comentarios de clientes de 550 caracteres cada uno y necesita crear versiones de los documentos con partes suprimidas antes de archivarlos. Supongamos que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada pedido = 550 caracteres

Número de unidades por solicitud = 6

Total de unidades = 60 000 [10 000 solicitudes x 6 unidades por solicitud]

Precio por unidad = 0,0001 USD

Costo total = 6 USD [60 000 unidades x 0,0001 USD]

Ejemplo 9: extracción de entidades de una solicitud de hipoteca con la API de entidades personalizadas

Digamos que quiere formar un modelo de extracción de entidades personalizadas para extraer 10 entidades personalizadas de una solicitud de hipoteca. Cien clientes presentan una solicitud cada día, cada uno de los cuales proporciona un documento PDF escaneado de 10 páginas que contiene 2500 caracteres por página. Con Amazon Textract, supongamos que tenemos que extraer el texto de cada una de las páginas procesadas antes de extraer las entidades mediante la API de detección de texto de documentos. Se tarda una hora en formar el modelo personalizado y tiene pensado mantener este modelo durante un mes. Por lo tanto, la formación de modelos costará 3 USD y el de almacenamiento costará 0,50 USD por mes. Supongamos también que este es su segundo año de uso del servicio y no es elegible para la oferta del nivel gratuito. Para extraer entidades personalizadas de forma asíncrona, se paga por número de caracteres en los documentos. Para extraer entidades en tiempo real, aprovisiona un punto de enlace con suficiente rendimiento para gestionar el caso de uso y pagar por el tiempo que el punto de enlace termina.

Cálculo del costo de inferencia por la clasificación asíncrona:

Tamaño de cada solicitud por día = 2 500 000 caracteres [100 solicitudes por día * 10 documentos * 2500 caracteres].

Número de unidades por solicitud = 25 000 unidades [2 500 000 caracteres ÷ 100 caracteres por unidad]

Precio por unidad = 0,0005 USD

Costo total de inferencia de las unidades = 12,50 USD [25 000 unidades x 0,0005 USD].

Costo de la API de detección de texto de documentos de Amazon Textract= 1,50 USD [100 aplicaciones por día * 10 documentos * 0,0015 USD de precio por página, hasta 1 millón de páginas]

Costo total = 17,50 USD [12,50 USD inferencia + 1,50 USD Textract + 3 USD formación de modelos + 0,50 USD almacenamiento del modelo]

 

Más información sobre las características de Amazon Comprehend

Visite la página de características
¿Está listo para comenzar?
Regístrese
¿Tiene más preguntas?
Contacte con nosotros