Amazon Comprehend ofrece capacidades de procesamiento de lenguaje natural, modelado de temas y clasificación personalizada, lo que le habilita una amplia gama de aplicaciones para el análisis de texto.

  • Procesamiento de lenguaje natural: las API de Amazon Comprehend para el reconocimiento de entidades, el análisis de opiniones, el análisis sintáctico, la extracción de frases clave y la detección del idioma se pueden utilizar para extraer información del texto en lenguaje natural. Las solicitudes se miden en unidades de 100 caracteres (una unidad = 100 caracteres) con un cargo mínimo de tres unidades (300 caracteres) por solicitud.
  • Información de identificación personal (PII): la API de detección de PII encuentra las ubicaciones de las entidades de información de identificación personal (“PII”) elegidas dentro de un documento y se puede utilizar para crear versiones con partes suprimidas de los documentos. La API de PII le indica si un documento contiene o no la información de identificación personal elegida. Las solicitudes también se miden en unidades de 100 caracteres (una unidad = 100 caracteres) con un cargo mínimo de tres unidades (300 caracteres) por solicitud.
  • Comprehend personalizado: las API de clasificación y entidades personalizadas pueden entrenar un modelo de procesamiento de lenguaje natural personalizado para categorizar textos y extraer entidades personalizadas. Las solicitudes de inferencia asincrónica se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud. Se le cobrarán 3 USD por hora por el entrenamiento de modelos (se factura por segundo) y 0,50 USD por mes por la administración de modelos personalizados. Para la clasificación sincrónica personalizada y las solicitudes de inferencia de entidades, aprovisione un punto de enlace con el rendimiento adecuado. Se le aplicarán cargos desde el momento en que comienza el punto de enlace hasta que este se elimina.
  • Modelado de temas: el modelado de temas identifica los términos o temas relevantes de una colección de documentos almacenados en Amazon S3. Identifica los temas más comunes del conjunto y los organiza en grupos. A continuación, identifica qué documentos pertenecen a qué tema. Se aplicarán cargos en base al tamaño total de los documentos procesados por trabajo. Se aplica un cargo plano para los primeros 100 MB. Al superar los 100 MB, se aplica un cargo por cada MB.
  • Puede estimar los costos con la calculadora de precios de AWS.
Para los volúmenes de más de 100 millones de unidades por mes, contacte con nosotros si desea consultar los precios.
Las solicitudes de procesamiento de lenguaje natural se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.
Comprehend personalizado

Entidades y clasificación personalizadas
Para la clasificación asincrónica y el reconocimiento de entidades

Las solicitudes de inferencia se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.

Para la clasificación sincrónica y el reconocimiento de entidades

Los puntos de enlace se facturan en incrementos de 1 segundo, por un mínimo de 60 segundos. Los cargos continuarán generándose desde el momento en que comienza el punto de enlace hasta que se elimina, incluso si no se analiza ningún documento.

Una unidad de inferencia (IU) ofrece un rendimiento de 100 caracteres por segundo en el punto de enlace administrado. Puede aprovisionar IU adicionales para un rendimiento mayor. Cada IU generará un costo de 0,0005 USD por segundo.

3 USD por hora para entrenamiento de modelos
Modelado de temas

Para los primeros 100 MB

Por cada MB que supere los 100 MB

Se aplicarán cargos en base al tamaño total de los documentos procesados por trabajo de modelado de tema. Para los primeros 100 MB se aplica una tarifa fija. Al superar los 100 MB, se aplica un cargo por cada MB.

Capa gratuita

50 000 unidades de texto (5 millones de caracteres)

Para cada una de las 9 API (extracción de frases claves, análisis de opiniones, reconocimiento de entidades, detección de idiomas, detección de información de identificación personal, contiene información de identificación personal, detección de eventos, análisis sintáctico, clasificación personalizada y entidades personalizadas) por mes, a partir de la fecha de la primera solicitud de Amazon Comprehend.

En el caso de la clasificación personalizada y las entidades personalizadas, no existe capa gratuita para el entrenamiento, la administración de modelos ni los puntos de enlace.

5 trabajos de hasta 1 MB cada uno

Para el modelado de temas

La capa gratuita de Amazon Comprehend está disponible para clientes nuevos y existentes de AWS durante 12 meses, a partir de la fecha de su primera solicitud de Amazon Comprehend.

Precios de Amazon Comprehend Medical

Con Amazon Comprehend Medical, paga únicamente por lo que usa. Se cobra en función de la cantidad de texto procesado mensualmente. Amazon Comprehend Medical proporciona dos API: Medical Named Entity and Relationship Extraction (NERe) y Protected Health Information Data Extraction and Identification (PHId).

La API Medical NERe extrae entidades, relaciones entre entidades, características de entidades e información sanitaria protegida (PHI, por sus siglas en inglés). Si los clientes solo quieren identificar PHI con fines de protección de datos, pueden solicitar la API PHId. Todas las solicitudes de API se miden en unidades de 100 caracteres con un cargo mínimo de una unidad (100 caracteres) por solicitud.

Capa gratuita de Amazon Comprehend Medical

Amazon Comprehend Medical ofrece una capa gratuita que cubre 25 000 unidades de texto (2,5 millones de caracteres) durante los primeros tres meses siguientes al inicio del uso del servicio para cualquiera de las API.

Ejemplos de aplicación de precios de Amazon Comprehend

Ejemplo 1 – Análisis de comentarios de clientes

Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en su tienda en línea. Ha recibido 10 000 comentarios del cliente que tienen 550 caracteres cada uno y está en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada pedido = 550 caracteres

Número de unidades por solicitud = 6

Total de unidades: 10 000 (pedidos) x 6 (unidades por pedido) = 60 000

Precio por unidad = 0,0001 USD

Costo total = [N.º de unidades] x [Costo por unidad] = 60 000 x 0,0001 USD = 6,00 USD


Ejemplo 2 – Categorización de documentos por tema

Digamos que tiene un conjunto de documentos de investigación que conforman un total de 240 MB de tamaño que quiere categorizar por tema y recomendar los documentos a sus clientes en base a sus áreas de interés. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Cálculo de cargos totales:

Total de megabytes procesados = 240

Megabytes facturados a tarifa plana de 1 USD = 100

Megabytes facturados a 0,004 USD/MB = 140 [240-100]

Costo total del trabajo = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD


Ejemplo 3 – Clasificación de comentarios de los clientes mediante la API de Clasificación personalizada

Supongamos que usted quiere entrenar un clasificador con la finalidad de organizar de manera automática los comentarios de los clientes nuevos que ingresan desde su sitio web. Cada minuto, hay 10 clientes que escriben comentarios y cada comentario contiene 300 caracteres. Lleva una hora entrenar el modelo personalizado y usted tiene pensado mantener este modelo durante un mes. Por lo tanto, el modelo de capacitación costará 3 USD y el de almacenamiento costará 0,5 USD por mes. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Para clasificar el comentario de manera asincrónica, paga por número de caracteres en sus documentos. Para clasificar en tiempo real, aprovisiona un punto de enlace con suficiente rendimiento para gestionar el caso de uso y pagar por el tiempo que el punto de enlace termina. 

Cálculo del costo de inferencia por la clasificación asincrónica:

Tamaño de cada solicitud por día = 4 320 000 caracteres [300 caracteres * 10 documentos * 1440 minutos]

Número de unidades por solicitud = 43 200 unidades [432 000 caracteres ÷ 100 caracteres por unidad]

Precio por unidad = 0,0005 USD

Costo de inferencia total por unidades = 21,60 USD [43 200 unidades x 0,0005 USD]

Costo total = 25,10 USD [21,60 USD por inferencia + 3 USD por capacitación de modelo + 0,50 USD por almacenamiento de modelo]

Cálculo de cargo total para la clasificación sincrónica:

Primero, calculemos el rendimiento requerido. Por minuto, clasificamos 10 documentos de 300 caracteres cada uno. Es decir:

50 caracteres por segundo [300 caracteres x 10 documentos ÷ 60 segundos]

Entonces, deberá aprovisionar un punto de enlace con 1 unidad de inferencia (IU), que otorga un rendimiento de 100 caracteres por segundo.

Precio por 1 IU = 0,0005 USD por segundo

Incurrirá en costos dependiendo de por cuánto tiempo mantenga activo el punto de enlace de clasificación en tiempo real, independientemente de cuántas llamadas de inferencia se realicen.

Si ejecuta el punto de enlace de clasificación en tiempo real durante 12 horas por día:

Costo de inferencia total = 21,60 USD [0,0005 USD x 3600 segundos x 12 horas]

Costo total = 25,10 USD [21,60 USD por inferencia + 3 USD por capacitación de modelo + 0,50 USD por almacenamiento de modelo]

Tenga en cuenta que incurrirá en costos por el rendimiento aprovisionado y por la cantidad de tiempo en que el punto de enlace esté activo. Si necesita aprovisionar más rendimiento, el precio será:

Precio por 2 IU = 0,001 USD por segundo [0,0005 USD x 2]

Precio por 3 IU = 0,0015 USD por segundo [0,0005 USD x 3]


Ejemplo 4 – Extracción de entidades médicas de documentos clínicos

Supongamos que ha creado una aplicación que usa Amazon Comprehend Medical para analizar los documentos clínicos en su lago de datos. Tiene 1000 documentos clínicos con 2550 caracteres cada uno. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Cálculo de cargos totales:

Tamaño de cada solicitud = 2550 caracteres

Número de unidades por solicitud = 26 unidades [2550 caracteres ÷ 100 caracteres por unidad]

Total de unidades: 1000 (solicitudes) x 26 (unidades por pedido) = 26 000

Precio por unidad = 0,01 USD

Costo total = [N.º de unidades] x [Costo por unidad] = 26 000 x 0,01 USD = 260,00 USD


Ejemplo 5 - Análisis de comentarios de clientes mediante la API de entidades personalizadas

Supongamos que desea entrenar un modelo de entidad personalizado para extraer automáticamente términos personalizados de los comentarios de los clientes que proceden de su sitio web. El trabajo de entrenamiento dura 1,5 horas y se analizan 10.000 elementos de comentarios de clientes de 550 caracteres cada uno. Planea mantener este modelo durante un mes. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Cálculo de cargos totales:

Tamaño de cada pedido = 5,500,000 caracteres

Número de unidades por solicitud = 55,000 units [5,500,000 caracteres ÷ 100 caracteres por unidad]

Precio por unidad = 0,0005 USD

Costo total por unidades = 27,5 USD [55,000 unidades x 0,0005 USD]

Total de horas para entrenamiento de modelos = 1,5 horas

Precio por hora = 3 USD

Costo total para entrenamiento de modelos = 4.5 USD [1,5 horas x 3 USD]

Número de meses para la administración de modelos = 1 mes

Precio por mes = 0,50 USD 

Costo total para administración de modelos = 0,50 USD [1 mes x 0,50 USD]

Costo total = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]


Ejemplo 6: extracción de eventos y de la información asociada mediante la detección de eventos

Supongamos que desea extraer 3 tipos de eventos a partir de 3000 artículos de 500 caracteres cada uno y que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Número de caracteres procesados = 1 500 00 caracteres [3000 artículos x 500 caracteres]

Número de unidades procesadas = 45 000 unidades [1 500 000 x 3 tipos de eventos ÷ 100 caracteres por unidad]

Precio por unidad = 0,003 USD

Costo total por unidades = 135 USD [45 000 unidades x 0,003 USD]


Ejemplo 7: identificación de documentos con información de identificación personal (PII) mediante la API denominada contiene PII

Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en su tienda en línea. Ha recibido 10 000 comentarios de clientes de 550 caracteres cada uno. Necesita identificar qué documentos contienen información de identificación personal para poder almacenarlos en una ubicación segura. Supongamos que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada pedido = 550 caracteres

Número de unidades por solicitud = 6

Total de unidades = 60 000 [10 000 solicitudes x 6 unidades por solicitud]

Precio por unidad = 0,000002 USD

Costo total = 0,12 USD [60 000 unidades x 0,000002 USD]

Ejemplo 8. editar de modo que no aparezca información de identificación personal en los documentos mediante la API de detección de información de identificación personal

Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en su tienda en línea. Ha recibido 10 000 comentarios de clientes de 550 caracteres cada uno y necesita crear versiones de los documentos con partes suprimidas antes de archivarlos. Supongamos que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada pedido = 550 caracteres

Número de unidades por solicitud = 6

Total de unidades = 60 000 [10 000 solicitudes x 6 unidades por solicitud]

Precio por unidad = 0,0001 USD

Costo total = 6 USD [60 000 unidades x 0,0001 USD]

Más información sobre las características de Amazon Comprehend

Visite la página de características
¿Está listo para comenzar?
Regístrese
¿Tiene más preguntas?
Contacte con nosotros