Amazon Comprehend

Amazon Comprehend ofrece el procesamiento de lenguaje natural, la detección y redacción de información de identificación personal (PII), la clasificación personalizada y la detección de entidades y el modelado de temas, lo cual habilita una amplia gama de aplicaciones que pueden analizar texto sin procesar y, con algunas API, formatos de documentos como PDF y Word.

Procesamiento de lenguaje natural: las API de Amazon Comprehend para el reconocimiento de entidades, el análisis de sentimientos, el análisis sintáctico, la extracción de frases clave y la detección del idioma se pueden utilizar para extraer información del texto en lenguaje natural. Las solicitudes se miden en unidades de 100 caracteres (1 unidad = 100 caracteres) con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.
Información de identificación personal (PII): la API de detección de PII encuentra las ubicaciones de las entidades de información de identificación personal (“PII”) elegidas dentro de un documento y se puede utilizar para crear versiones editadas de los documentos. La API que contiene PII indica si un documento contiene o no la información de identificación personal elegida. Las solicitudes también se miden en unidades de 100 caracteres (1 unidad = 100 caracteres) con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.
Comprehend personalizado: las API de clasificación y entidades personalizadas pueden entrenar un modelo de procesamiento de lenguaje natural (NLP) personalizado para categorizar textos y extraer entidades personalizadas. Las solicitudes de inferencia asincrónica se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud. Se le cobrarán 3 USD por hora por el entrenamiento de modelos (se factura por segundo) y 0,50 USD por mes por la administración de modelos personalizados. Para la clasificación sincrónica personalizada y las solicitudes de inferencia de entidades, aprovisione un punto de enlace con el rendimiento adecuado. Se aplican cargos desde el momento en que inicia el punto de conexión hasta que este se elimina.
Modelado de temas: el modelado de temas identifica los términos o temas relevantes de una colección de documentos almacenados en Amazon S3. Identifica los temas más comunes del conjunto y los organiza en grupos. A continuación, identifica qué documentos pertenecen a qué tema. Se aplicarán cargos en base al tamaño total de los documentos procesados por trabajo. Se aplica un cargo plano para los primeros 100 MB. Al superar los 100 MB, se aplica un cargo por cada MB.
Confianza y seguridad (nueva): la API de detección de toxicidad de Comprehend se puede utilizar para detectar contenido tóxico en el texto. Del mismo modo, la característica de clasificación de seguridad de mensajes de Comprehend se puede utilizar para detectar mensajes de entrada no seguros en aplicaciones y modelos de lenguajes de gran tamaño. Las solicitudes se miden en unidades de 100 caracteres (1 unidad = 100 caracteres) con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.
Para conocer los precios de Amazon Comprehend Medical, consulte esta página.
Puede estimar los costos con la calculadora de precios de AWS.
Seleccione la región EE UU. Este (Norte de Virginia) en el selector de regiones que aparece a continuación para ver los precios de todas las API

Para los volúmenes de más de 100 millones de unidades por mes, contacte con nosotros si desea consultar los precios.

Las solicitudes de procesamiento de lenguaje natural se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.

Con las API de Amazon Comprehend, puede procesar tanto texto sin estructurar como, con algunas API, otros archivos de texto como documentos PDF y Word.

Comprehend personalizado

Entidades y clasificación personalizadas

Para el reconocimiento asíncrono de entidades en documentos PDF*, Word y texto sin formato

Las solicitudes de inferencia se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.

Para la clasificación asíncrona

Las solicitudes de inferencia se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.

Para la clasificación sincrónica y el reconocimiento de entidades

Los puntos de enlace se facturan en incrementos de 1 segundo, por un mínimo de 60 segundos. Los cargos continuarán generándose desde el momento en que comienza el punto de enlace hasta que se elimina, incluso si no se analiza ningún documento.

Una unidad de inferencia (IU) ofrece un rendimiento de 100 caracteres por segundo en el punto de enlace administrado. Puede aprovisionar IU adicionales para un rendimiento mayor. Cada IU generará un costo de 0,0005 USD por segundo.

3 USD por hora para entrenamiento de modelos

*para extraer el texto de los documentos PDF escaneados se llama a la API de detección de texto de documentos de Amazon Textract.

Modelado de temas

Para los primeros 100 MB

Por cada MB que supere los 100 MB

Se aplicarán cargos en base al tamaño total de los documentos procesados por trabajo de modelado de tema. Para los primeros 100 MB se aplica una tarifa fija. Al superar los 100 MB, se aplica un cargo por cada MB.

Nivel gratuito

50 000 UNIDADES DE TEXTO (5 MILLONES DE CARACTERES)

Amazon Comprehend brinda un nivel gratuito que cubre 50 000 unidades de texto (5 millones de caracteres) por API y por mes.

Las API elegibles incluyen Key Phrase Extraction (Extracción de frases clave), Sentiment (Opinión), Targeted Sentiment (Opinión focalizada), Entity Recognition (Reconocimiento de entidades), Language Detection (Detección de idioma), Event Detection (Detección de eventos), Syntax Analysis (Análisis sintáctico), Detect PII (Detección de PII), Contains PII (Contiene PII) y Prompt Safety Classification (Clasificación de seguridad rápida).

Nota: Custom Comprehend (entidades personalizadas y clasificación personalizada) no ofrece un nivel gratuito. Esto incluye entrenamiento de modelos, inferencia y administración de modelos.

5 trabajos de hasta 1 MB cada uno (modelado de temas)

El nivel gratuito de Amazon Comprehend está disponible para clientes nuevos y existentes de AWS durante 12 meses, a partir de la fecha de la primera solicitud de Amazon Comprehend.

Ejemplos de precios de Amazon Comprehend

Ejemplo 1 – Análisis de comentarios de clientes

Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en su tienda en línea. Ha recibido 10 000 comentarios del cliente que tienen 550 caracteres cada uno y está en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada pedido = 550 caracteres

Número de unidades por solicitud = 6

Total de unidades: 10 000 (pedidos) x 6 (unidades por pedido) = 60 000

Precio por unidad = 0,0001 USD

Costo total = [N.º de unidades] x [Costo por unidad] = 60 000 x 0,0001 USD = 6,00 USD

Ejemplo 2 – Categorización de documentos por tema

Digamos que tiene un conjunto de documentos de investigación que conforman un total de 240 MB de tamaño que quiere categorizar por tema y recomendar los documentos a sus clientes en base a sus áreas de interés. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Cálculo de cargos totales:

Total de megabytes procesados = 240

Megabytes facturados a tarifa plana de 1 USD = 100

Megabytes facturados a 0,004 USD/MB = 140 [240-100]

Costo total del trabajo = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD

Ejemplo 3 – Clasificación de comentarios de los clientes mediante la API de Clasificación personalizada

Supongamos que usted quiere entrenar un clasificador con la finalidad de organizar de manera automática los comentarios de los clientes nuevos que ingresan desde su sitio web. Cada minuto, hay 10 clientes que escriben comentarios y cada comentario contiene 300 caracteres. Lleva una hora entrenar el modelo personalizado y usted tiene pensado mantener este modelo durante un mes. Por lo tanto, el modelo de capacitación costará 3 USD y el de almacenamiento costará 0,5 USD por mes. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Para clasificar el comentario de manera asincrónica, paga por número de caracteres en sus documentos. Para clasificar en tiempo real, aprovisiona un punto de enlace con suficiente rendimiento para gestionar el caso de uso y pagar por el tiempo que el punto de enlace termina.

Cálculo del costo de inferencia por la clasificación asincrónica:

Tamaño de cada solicitud por día = 4 320 000 caracteres [300 caracteres * 10 documentos * 1440 minutos]

Número de unidades por solicitud = 43 200 unidades [432 000 caracteres ÷ 100 caracteres por unidad]

Precio por unidad = 0,0005 USD

Costo de inferencia total por unidades = 21,60 USD [43 200 unidades x 0,0005 USD]

Costo total = 25,10 USD [21,60 USD por inferencia + 3 USD por capacitación de modelo + 0,50 USD por almacenamiento de modelo]

Cálculo de cargo total para la clasificación sincrónica:

Primero, calculemos el rendimiento requerido. Por minuto, clasificamos 10 documentos de 300 caracteres cada uno. Es decir:

50 caracteres por segundo [300 caracteres x 10 documentos ÷ 60 segundos]

Entonces, deberá aprovisionar un punto de enlace con 1 unidad de inferencia (IU), que otorga un rendimiento de 100 caracteres por segundo.

Precio por 1 IU = 0,0005 USD por segundo

Incurrirá en costos dependiendo de por cuánto tiempo mantenga activo el punto de enlace de clasificación en tiempo real, independientemente de cuántas llamadas de inferencia se realicen.

Si ejecuta el punto de enlace de clasificación en tiempo real durante 12 horas por día:

Costo de inferencia total = 21,60 USD [0,0005 USD x 3600 segundos x 12 horas]

Costo total = 25,10 USD [21,60 USD por inferencia + 3 USD por capacitación de modelo + 0,50 USD por almacenamiento de modelo]

Tenga en cuenta que incurrirá en costos por el rendimiento aprovisionado y por la cantidad de tiempo en que el punto de enlace esté activo. Si necesita aprovisionar más rendimiento, el precio será:

Precio por 2 IU = 0,001 USD por segundo [0,0005 USD x 2]

Precio por 3 IU = 0,0015 USD por segundo [0,0005 USD x 3]

Ejemplo 4: análisis de comentarios de clientes mediante la API de entidades personalizadas

Supongamos que desea entrenar un modelo de entidad personalizado para extraer automáticamente los términos personalizados de los comentarios de los clientes que proceden de su sitio web. El trabajo de entrenamiento dura 1,5 horas y se analizan 10.000 elementos de comentarios de clientes de 550 caracteres cada uno. Planea mantener este modelo durante un mes. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.

Cálculo de cargos totales:

Tamaño de cada pedido = 5,500,000 caracteres

Número de unidades por solicitud = 55,000 units [5,500,000 caracteres ÷ 100 caracteres por unidad]

Precio por unidad = 0,0005 USD

Costo total por unidades = 27,5 USD [55 000 unidades x 0,0005 USD]

Total de horas para entrenamiento de modelos = 1,5 horas

Precio por hora = 3 USD

Costo total para entrenamiento de modelos = 4.5 USD [1,5 horas x 3 USD]

Número de meses para la administración de modelos = 1 mes

Precio por mes = 0,50 USD

Costo total por la administración de modelos = 0,50 USD [1 mes x 0,50 USD]

Costo total = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]

Ejemplo 5: extracción de eventos y de la información asociada mediante la detección de eventos

Supongamos que desea extraer 3 tipos de eventos a partir de 3 000 artículos de 500 caracteres cada uno y que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Número de caracteres procesados = 1 500 000 caracteres [3000 artículos x 500 caracteres]

Número de unidades procesadas = 45 000 unidades [1 500 000 x 3 tipos de eventos ÷ 100 caracteres por unidad]

Precio por unidad = 0,003 USD

Costo total por unidades = 135 USD [45 000 unidades x 0,003 USD]

Ejemplo 6: identificación de documentos con información de identificación personal (PII) mediante la API que contiene PII

Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en una tienda en línea. Ha recibido 10 000 comentarios de clientes de 550 caracteres cada uno. Necesita identificar qué documentos contienen información de identificación personal para poder almacenarlos en una ubicación segura. Supongamos que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada pedido = 550 caracteres

Número de unidades por solicitud = 6

Total de unidades = 60 000 [10 000 solicitudes x 6 unidades por solicitud]

Precio por unidad = 0,000002 USD

Costo total = 0,12 USD [60 000 unidades x 0,000002 USD]

Ejemplo 7: editar información de identificación personal (PII) en los documentos mediante la API de detección de información de identificación personal

Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en una tienda en línea. Ha recibido 10 000 comentarios de clientes de 550 caracteres cada uno y necesita crear versiones de los documentos con partes suprimidas antes de archivarlos. Supongamos que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada pedido = 550 caracteres

Número de unidades por solicitud = 6

Total de unidades = 60 000 [10 000 solicitudes x 6 unidades por solicitud]

Precio por unidad = 0,0001 USD

Costo total = 6 USD [60 000 unidades x 0,0001 USD]

Ejemplo 8: extracción de entidades de una solicitud de hipoteca con la API de entidades personalizadas

Digamos que quiere entrenar un modelo de extracción de entidades personalizadas para extraer 10 entidades personalizadas de una solicitud de hipoteca. Cien clientes presentan una solicitud cada día, cada uno de los cuales proporciona un documento PDF escaneado de 10 páginas que contiene 2500 caracteres por página. Con Amazon Textract, supongamos que tenemos que extraer el texto de cada una de las páginas procesadas antes de extraer las entidades mediante la API de detección de texto de documentos. Se tarda una hora en formar el modelo personalizado y tiene pensado mantener este modelo durante un mes. Por lo tanto, la formación de modelos costará 3 USD y el de almacenamiento costará 0,50 USD por mes. Supongamos también que este es su segundo año de uso del servicio y no es elegible para la oferta del nivel gratuito. Para extraer entidades personalizadas de forma asíncrona, se paga por número de caracteres en los documentos. Para extraer entidades en tiempo real, aprovisiona un punto de enlace con suficiente rendimiento para gestionar el caso de uso y pagar por el tiempo que el punto de enlace termina.

Cálculo del costo de inferencia por la clasificación asíncrona:

Tamaño de cada solicitud por día = 2 500 000 caracteres [100 solicitudes por día * 10 documentos * 2500 caracteres].

Número de unidades por solicitud = 25 000 unidades [2 500 000 caracteres ÷ 100 caracteres por unidad]

Precio por unidad = 0,0005 USD

Costo total de inferencia de las unidades = 12,50 USD [25 000 unidades x 0,0005 USD].

Costo de la API de detección de texto de documentos de Amazon Textract= 1,50 USD [100 aplicaciones por día * 10 documentos * 0,0015 USD de precio por página, hasta 1 millón de páginas]

Costo total = 17,50 USD [12,50 USD por inferencia + 1,50 USD Textract + 3 USD por entrenamiento de modelo + 0,50 USD por almacenamiento del modelo]

Ejemplo 9: análisis de las respuestas a las encuestas de los empleados

Asumamos que ha creado una aplicación mediante la opinión focalizada de Amazon Comprehend para analizar las respuestas a las encuestas a los empleados para su empresa. Ha recibido 100 000 respuestas a la encuesta que tienen 350 caracteres cada una y está en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada solicitud = 350 caracteres

Número de unidades por solicitud = 4

Total de unidades: 100 000 (solicitudes) x 4 (unidades por solicitud) = 400 000

Precio por unidad = 0,0001 USD (de 0 a 10 millones de unidades)

Costo total = [N.º de unidades] x [Costo por unidad] = 400 000 x 0,0001 USD = 40,00 USD

Ejemplo 10: detección de toxicidad en los comentarios en línea en el sitio web

Supongamos que ha creado una aplicación con Amazon Comprehend para detectar la toxicidad en los comentarios de su sitio web. Ha recibido 100 millones de comentarios de clientes de 100 caracteres cada uno, y necesitas identificar qué comentarios son de naturaleza tóxica y deben redactarse. Supongamos que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada solicitud = 100 caracteres

Número de unidades por solicitud = 1 total

Unidades = 100 millones de IU [100 millones de comentarios x 1 unidad por solicitud]

Precio por unidad = 0,0001 USD [de 0 a 10 millones de IU] + 0,00005 USD [de 10 a 50 millones de IU] + 0,000025 USD [de 50 a 100 millones de IU]

Costo total = [N.º de unidades] x [Costo por unidad]

= [10 millones X 0,001 USD] + [40 millones X 0,00005] + [50 millones X 0,000025]

= 1000 USD + 2000 USD + 1250 USD

= 4250 USD

Ejemplo 11: detección de mensajes no seguros en una aplicación de IA generativa

Supongamos que ha creado una aplicación con Amazon Comprehend para detectar mensajes de entrada no seguros cuando los usuarios interactúan con su producto de IA generativa. Ha recibido 10 millones de mensajes de entrada de 500 caracteres cada uno y necesita identificar qué mensajes no son seguros. Supongamos que se encuentra en el segundo año de uso del servicio.

Cálculo de cargos totales:

Tamaño de cada solicitud = 500 caracteres

Número de unidades por solicitud = 5

Unidades totales = 50 millones de IU [10 millones de comentarios x 5 unidades por solicitud]

Precio por unidad = 0,0001 USD [de 0 a 10 millones de IU] + 0,00005 USD [de 10 a 50 millones de IU] + 0,000025 USD [de 50 a 100 millones de IU]

Costo total = [N.º de unidades] x [Costo por unidad]

= [10 millones X 0,001 USD] + [40 millones X 0,00005]

= 1000 USD + 2000 USD

= 3000 USD

Más información sobre las características de Amazon Comprehend

Visite la página de características

¿Está listo para comenzar?

Regístrese

¿Tiene más preguntas?

Contacte con nosotros

Precios de Amazon Comprehend

Ejemplos de precios de Amazon Comprehend

Ejemplo 1 – Análisis de comentarios de clientes

Ejemplo 2 – Categorización de documentos por tema

Ejemplo 3 – Clasificación de comentarios de los clientes mediante la API de Clasificación personalizada

Ejemplo 4: análisis de comentarios de clientes mediante la API de entidades personalizadas

Ejemplo 5: extracción de eventos y de la información asociada mediante la detección de eventos

Ejemplo 6: identificación de documentos con información de identificación personal (PII) mediante la API que contiene PII

Ejemplo 7: editar información de identificación personal (PII) en los documentos mediante la API de detección de información de identificación personal

Ejemplo 8: extracción de entidades de una solicitud de hipoteca con la API de entidades personalizadas

Ejemplo 9: análisis de las respuestas a las encuestas de los empleados

Ejemplo 10: detección de toxicidad en los comentarios en línea en el sitio web

Ejemplo 11: detección de mensajes no seguros en una aplicación de IA generativa

Finalización de la compatibilidad con Internet Explorer