Amazon Comprehend ofrece el procesamiento de lenguaje natural, la detección y redacción de información de identificación personal (PII), la clasificación personalizada y la detección de entidades y el modelado de temas, lo cual habilita una amplia gama de aplicaciones que pueden analizar texto sin procesar y, con algunas API, formatos de documentos como PDF y Word.
- Procesamiento de lenguaje natural: las API de Amazon Comprehend para el reconocimiento de entidades, el análisis de sentimientos, el análisis sintáctico, la extracción de frases clave y la detección del idioma se pueden utilizar para extraer información del texto en lenguaje natural. Las solicitudes se miden en unidades de 100 caracteres (1 unidad = 100 caracteres) con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.
- Información de identificación personal (PII): la API de detección de PII encuentra las ubicaciones de las entidades de información de identificación personal (“PII”) elegidas dentro de un documento y se puede utilizar para crear versiones editadas de los documentos. La API que contiene PII indica si un documento contiene o no la información de identificación personal elegida. Las solicitudes también se miden en unidades de 100 caracteres (1 unidad = 100 caracteres) con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.
- Comprehend personalizado: las API de clasificación y entidades personalizadas pueden entrenar un modelo de procesamiento de lenguaje natural (NLP) personalizado para categorizar textos y extraer entidades personalizadas. Las solicitudes de inferencia asincrónica se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud. Se le cobrarán 3 USD por hora por el entrenamiento de modelos (se factura por segundo) y 0,50 USD por mes por la administración de modelos personalizados. Para la clasificación sincrónica personalizada y las solicitudes de inferencia de entidades, aprovisione un punto de enlace con el rendimiento adecuado. Se aplican cargos desde el momento en que inicia el punto de conexión hasta que este se elimina.
- Modelado de temas: el modelado de temas identifica los términos o temas relevantes de una colección de documentos almacenados en Amazon S3. Identifica los temas más comunes del conjunto y los organiza en grupos. A continuación, identifica qué documentos pertenecen a qué tema. Se aplicarán cargos en base al tamaño total de los documentos procesados por trabajo. Se aplica un cargo plano para los primeros 100 MB. Al superar los 100 MB, se aplica un cargo por cada MB.
- Confianza y seguridad (nueva): la API de detección de toxicidad de Comprehend se puede utilizar para detectar contenido tóxico en el texto. Del mismo modo, la característica de clasificación de seguridad de mensajes de Comprehend se puede utilizar para detectar mensajes de entrada no seguros en aplicaciones y modelos de lenguajes de gran tamaño. Las solicitudes se miden en unidades de 100 caracteres (1 unidad = 100 caracteres) con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.
- Para conocer los precios de Amazon Comprehend Medical, consulte esta página.
- Puede estimar los costos con la calculadora de precios de AWS.
- Seleccione la región EE UU. Este (Norte de Virginia) en el selector de regiones que aparece a continuación para ver los precios de todas las API
Con las API de Amazon Comprehend, puede procesar tanto texto sin estructurar como, con algunas API, otros archivos de texto como documentos PDF y Word.
Las solicitudes de inferencia se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.
Las solicitudes de inferencia se miden en unidades de 100 caracteres con un cargo mínimo de 3 unidades (300 caracteres) por solicitud.
Los puntos de enlace se facturan en incrementos de 1 segundo, por un mínimo de 60 segundos. Los cargos continuarán generándose desde el momento en que comienza el punto de enlace hasta que se elimina, incluso si no se analiza ningún documento.
Una unidad de inferencia (IU) ofrece un rendimiento de 100 caracteres por segundo en el punto de enlace administrado. Puede aprovisionar IU adicionales para un rendimiento mayor. Cada IU generará un costo de 0,0005 USD por segundo.
*para extraer el texto de los documentos PDF escaneados se llama a la API de detección de texto de documentos de Amazon Textract.
Para los primeros 100 MB
Por cada MB que supere los 100 MB
Se aplicarán cargos en base al tamaño total de los documentos procesados por trabajo de modelado de tema. Para los primeros 100 MB se aplica una tarifa fija. Al superar los 100 MB, se aplica un cargo por cada MB.
Amazon Comprehend brinda un nivel gratuito que cubre 50 000 unidades de texto (5 millones de caracteres) por API y por mes.
Las API elegibles incluyen Key Phrase Extraction (Extracción de frases clave), Sentiment (Opinión), Targeted Sentiment (Opinión focalizada), Entity Recognition (Reconocimiento de entidades), Language Detection (Detección de idioma), Event Detection (Detección de eventos), Syntax Analysis (Análisis sintáctico), Detect PII (Detección de PII), Contains PII (Contiene PII) y Prompt Safety Classification (Clasificación de seguridad rápida).
Nota: Custom Comprehend (entidades personalizadas y clasificación personalizada) no ofrece un nivel gratuito. Esto incluye entrenamiento de modelos, inferencia y administración de modelos.
El nivel gratuito de Amazon Comprehend está disponible para clientes nuevos y existentes de AWS durante 12 meses, a partir de la fecha de la primera solicitud de Amazon Comprehend.
Ejemplos de precios de Amazon Comprehend
Ejemplo 1 – Análisis de comentarios de clientes
Supongamos que ha creado una aplicación con Amazon Comprehend para analizar los comentarios de los clientes en su tienda en línea. Ha recibido 10 000 comentarios del cliente que tienen 550 caracteres cada uno y está en el segundo año de uso del servicio.
Cálculo de cargos totales:
Tamaño de cada pedido = 550 caracteres
Número de unidades por solicitud = 6
Total de unidades: 10 000 (pedidos) x 6 (unidades por pedido) = 60 000
Precio por unidad = 0,0001 USD
Costo total = [N.º de unidades] x [Costo por unidad] = 60 000 x 0,0001 USD = 6,00 USD
Ejemplo 2 – Categorización de documentos por tema
Digamos que tiene un conjunto de documentos de investigación que conforman un total de 240 MB de tamaño que quiere categorizar por tema y recomendar los documentos a sus clientes en base a sus áreas de interés. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.
Cálculo de cargos totales:
Total de megabytes procesados = 240
Megabytes facturados a tarifa plana de 1 USD = 100
Megabytes facturados a 0,004 USD/MB = 140 [240-100]
Costo total del trabajo = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD
Ejemplo 3 – Clasificación de comentarios de los clientes mediante la API de Clasificación personalizada
Supongamos que usted quiere entrenar un clasificador con la finalidad de organizar de manera automática los comentarios de los clientes nuevos que ingresan desde su sitio web. Cada minuto, hay 10 clientes que escriben comentarios y cada comentario contiene 300 caracteres. Lleva una hora entrenar el modelo personalizado y usted tiene pensado mantener este modelo durante un mes. Por lo tanto, el modelo de capacitación costará 3 USD y el de almacenamiento costará 0,5 USD por mes. Supongamos también que usted está en el segundo año de uso del servicio y no es elegible para la oferta de la capa gratuita.
Para clasificar el comentario de manera asincrónica, paga por número de caracteres en sus documentos. Para clasificar en tiempo real, aprovisiona un punto de enlace con suficiente rendimiento para gestionar el caso de uso y pagar por el tiempo que el punto de enlace termina.
Cálculo del costo de inferencia por la clasificación asincrónica:
Tamaño de cada solicitud por día = 4 320 000 caracteres [300 caracteres * 10 documentos * 1440 minutos]
Número de unidades por solicitud = 43 200 unidades [432 000 caracteres ÷ 100 caracteres por unidad]
Precio por unidad = 0,0005 USD
Costo de inferencia total por unidades = 21,60 USD [43 200 unidades x 0,0005 USD]
Costo total = 25,10 USD [21,60 USD por inferencia + 3 USD por capacitación de modelo + 0,50 USD por almacenamiento de modelo]
Cálculo de cargo total para la clasificación sincrónica:
Primero, calculemos el rendimiento requerido. Por minuto, clasificamos 10 documentos de 300 caracteres cada uno. Es decir:
50 caracteres por segundo [300 caracteres x 10 documentos ÷ 60 segundos]
Entonces, deberá aprovisionar un punto de enlace con 1 unidad de inferencia (IU), que otorga un rendimiento de 100 caracteres por segundo.
Precio por 1 IU = 0,0005 USD por segundo
Incurrirá en costos dependiendo de por cuánto tiempo mantenga activo el punto de enlace de clasificación en tiempo real, independientemente de cuántas llamadas de inferencia se realicen.
Si ejecuta el punto de enlace de clasificación en tiempo real durante 12 horas por día:
Costo de inferencia total = 21,60 USD [0,0005 USD x 3600 segundos x 12 horas]
Costo total = 25,10 USD [21,60 USD por inferencia + 3 USD por capacitación de modelo + 0,50 USD por almacenamiento de modelo]
Tenga en cuenta que incurrirá en costos por el rendimiento aprovisionado y por la cantidad de tiempo en que el punto de enlace esté activo. Si necesita aprovisionar más rendimiento, el precio será:
Precio por 2 IU = 0,001 USD por segundo [0,0005 USD x 2]
Precio por 3 IU = 0,0015 USD por segundo [0,0005 USD x 3]
Ejemplo 4: análisis de comentarios de clientes mediante la API de entidades personalizadas
Cálculo de cargos totales:
Tamaño de cada pedido = 5,500,000 caracteres
Número de unidades por solicitud = 55,000 units [5,500,000 caracteres ÷ 100 caracteres por unidad]
Precio por unidad = 0,0005 USD
Costo total por unidades = 27,5 USD [55 000 unidades x 0,0005 USD]
Total de horas para entrenamiento de modelos = 1,5 horas
Precio por hora = 3 USD
Costo total para entrenamiento de modelos = 4.5 USD [1,5 horas x 3 USD]
Número de meses para la administración de modelos = 1 mes
Precio por mes = 0,50 USD
Costo total por la administración de modelos = 0,50 USD [1 mes x 0,50 USD]
Costo total = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]
Ejemplo 5: extracción de eventos y de la información asociada mediante la detección de eventos
Cálculo de cargos totales:
Número de caracteres procesados = 1 500 000 caracteres [3000 artículos x 500 caracteres]
Número de unidades procesadas = 45 000 unidades [1 500 000 x 3 tipos de eventos ÷ 100 caracteres por unidad]
Precio por unidad = 0,003 USD
Costo total por unidades = 135 USD [45 000 unidades x 0,003 USD]
Ejemplo 6: identificación de documentos con información de identificación personal (PII) mediante la API que contiene PII
Cálculo de cargos totales:
Tamaño de cada pedido = 550 caracteres
Número de unidades por solicitud = 6
Total de unidades = 60 000 [10 000 solicitudes x 6 unidades por solicitud]
Precio por unidad = 0,000002 USD
Costo total = 0,12 USD [60 000 unidades x 0,000002 USD]
Ejemplo 7: editar información de identificación personal (PII) en los documentos mediante la API de detección de información de identificación personal
Cálculo de cargos totales:
Tamaño de cada pedido = 550 caracteres
Número de unidades por solicitud = 6
Total de unidades = 60 000 [10 000 solicitudes x 6 unidades por solicitud]
Precio por unidad = 0,0001 USD
Costo total = 6 USD [60 000 unidades x 0,0001 USD]
Ejemplo 8: extracción de entidades de una solicitud de hipoteca con la API de entidades personalizadas
Cálculo del costo de inferencia por la clasificación asíncrona:
Tamaño de cada solicitud por día = 2 500 000 caracteres [100 solicitudes por día * 10 documentos * 2500 caracteres].
Número de unidades por solicitud = 25 000 unidades [2 500 000 caracteres ÷ 100 caracteres por unidad]
Precio por unidad = 0,0005 USD
Costo total de inferencia de las unidades = 12,50 USD [25 000 unidades x 0,0005 USD].
Costo de la API de detección de texto de documentos de Amazon Textract= 1,50 USD [100 aplicaciones por día * 10 documentos * 0,0015 USD de precio por página, hasta 1 millón de páginas]
Costo total = 17,50 USD [12,50 USD por inferencia + 1,50 USD Textract + 3 USD por entrenamiento de modelo + 0,50 USD por almacenamiento del modelo]
Ejemplo 9: análisis de las respuestas a las encuestas de los empleados
Cálculo de cargos totales:
Tamaño de cada solicitud = 350 caracteres
Número de unidades por solicitud = 4
Total de unidades: 100 000 (solicitudes) x 4 (unidades por solicitud) = 400 000
Precio por unidad = 0,0001 USD (de 0 a 10 millones de unidades)
Costo total = [N.º de unidades] x [Costo por unidad] = 400 000 x 0,0001 USD = 40,00 USD
Ejemplo 10: detección de toxicidad en los comentarios en línea en el sitio web
Cálculo de cargos totales:
Tamaño de cada solicitud = 100 caracteres
Número de unidades por solicitud = 1 total
Unidades = 100 millones de IU [100 millones de comentarios x 1 unidad por solicitud]
Precio por unidad = 0,0001 USD [de 0 a 10 millones de IU] + 0,00005 USD [de 10 a 50 millones de IU] + 0,000025 USD [de 50 a 100 millones de IU]
Costo total = [N.º de unidades] x [Costo por unidad]
= [10 millones X 0,001 USD] + [40 millones X 0,00005] + [50 millones X 0,000025]
= 1000 USD + 2000 USD + 1250 USD
= 4250 USD
Ejemplo 11: detección de mensajes no seguros en una aplicación de IA generativa
Cálculo de cargos totales:
Tamaño de cada solicitud = 500 caracteres
Número de unidades por solicitud = 5
Unidades totales = 50 millones de IU [10 millones de comentarios x 5 unidades por solicitud]
Precio por unidad = 0,0001 USD [de 0 a 10 millones de IU] + 0,00005 USD [de 10 a 50 millones de IU] + 0,000025 USD [de 50 a 100 millones de IU]
Costo total = [N.º de unidades] x [Costo por unidad]
= [10 millones X 0,001 USD] + [40 millones X 0,00005]
= 1000 USD + 2000 USD
= 3000 USD
Más información sobre las características de Amazon Comprehend