Amazon Textract es un servicio de machine learning (ML) que extrae texto, escritura a mano y datos de documentos escaneados de manera automática. Va más allá del simple reconocimiento óptico de caracteres (OCR) para identificar, comprender y extraer datos de formularios y tablas. Con Amazon Textract, paga únicamente por lo que usa. No se requieren pagos mínimos ni compromisos iniciales. Amazon Textract solo cobra las páginas procesadas, independientemente de que extraiga texto, texto con tablas, datos de formularios, consultas, o procese facturas y documentos de identidad. Consulte las Preguntas frecuentes para obtener más detalles sobre las páginas y el uso aceptable de Amazon Textract.

Amazon Textract tiene cuatro API distintas: API para detectar texto de un documento, API para analizar documentos, API para analizar gastos y API para analizar los ID.

La API para detectar texto de un documento utiliza tecnología OCR para extraer texto y escritura a mano de un documento.

La API para analizar documentos tiene tres características: Formularios, Tablas y Consultas. Tiene la flexibilidad de llamar a cualquier combinación de formularios, tablas y consultas en conjunto.

  • La API para analizar documentos para formularios extrae datos como pares clave-valor (“Nombre” y valor asociado, como “Jane Smith”). También utiliza tecnología OCR para extraer todo el texto y la escritura a mano de un documento.
  • La API para analizar documentos para tablas extrae datos tabulares o de tablas organizados en columnas y filas. También utiliza tecnología OCR para extraer todo el texto y la escritura a mano de un documento.
  • La API para analizar documentos para consultas le ofrece la flexibilidad de especificar la información que necesita de un documento (por ejemplo, “¿Cuál es el nombre del cliente?”) y recibir ese dato (por ejemplo, “Jane Doe”) como parte de la respuesta. No tiene que ocuparse de la estructura de los datos en el documento ni de las variaciones en cómo se disponen los datos en los distintos formatos y versiones del documento. También utiliza tecnología OCR para extraer todo el texto y la escritura a mano de un documento.
 
La API para analizar gastos: extrae datos de facturas y recibos, como un ID de factura, n.º de factura, número de factura y el valor asociado de 12345. Amazon Textract reconoce estos diversos términos, como el ID de factura, y el valor correspondiente, como 12345, y permite una taxonomía estándar de los campos comunes. 
 
La API para analizar los ID utiliza el machine learning para comprender el contexto de los documentos de identidad, como los pasaportes estadounidenses, las licencias de conducir y otros documentos de identidad. Puede extraer de forma automática información específica, como la fecha de vencimiento y la fecha de nacimiento, además de identificar y extraer de forma inteligente información implícita, como el nombre y la dirección. La imagen de cada documento de identidad se considera una página.
 

Solicitar un presupuesto personalizado

Para casos de uso de gran volumen, contacte con nuestro equipo de ventas para solicitar una propuesta de precios personalizada.

Capa gratuita

Como parte del nivel Gratuito de AWS, puede comenzar a usar Amazon Textract sin costo. El nivel gratuito dura tres meses, y los nuevos clientes de AWS pueden analizar hasta:

API para detectar texto de un documento: 1000 páginas por mes
API para analizar documentos:

  • 100 páginas por mes, cuando se usa la característica para formularios o tablas
  • 100 páginas adicionales por mes cuando se usa la característica para consultas NUEVO

API para analizar gastos: 100 páginas por mes
API para analizar ID: 100 páginas por mes

Precios de la API de Amazon Textract

* La salida de la API para analizar documentos incluye OCR, independientemente del tipo de característica que seleccione.
* Las API para analizar gastos y los ID no incluyen OCR en la salida.

Ejemplos de precios fuera del nivel gratuito

Ejemplo de precios 1: API para detectar texto de un documento

Supongamos que desea extraer el texto de 100 000 páginas de informes de investigación con la API para detectar texto de un documento. El precio por página en la región Oeste de EE. UU. (Oregón) para el primer millón de páginas es de 0,0015 USD, con un costo de 150 USD.

Total de páginas procesadas = 100 000

Precio por página = 0,0015 USD

Costo total mensual = 0,0015 USD * 100 000 = 150 USD

Ejemplo de precios 2: API para detectar texto de un documento

Digamos que desea extraer el texto de dos millones de páginas de informes de investigación con la API para detectar texto de un documento. El precio por página en la región Oeste de EE. UU. (Oregón) para el primer millón de páginas es de 0,0015 USD, y las páginas posteriores al millón son de 0,0006 USD, por lo que, para procesar dos millones de páginas, el costo total sería de 2100 USD.

Total de páginas procesadas = 2 000 000

Precio por página = 0,0015 USD para el primer millón y 0,0006 USD por página después del millón

Costo total mensual = 0,0015 USD * 1 000 000 + 0,0006 USD * 1 000 000 = 1500 USD + 600 USD = 2100 USD

Ejemplo de precios 3: API para analizar documentos (formularios y tablas)

Digamos que desea extraer el texto y los datos estructurados de 5000 páginas de formularios de impuestos con la API para analizar documentos. El precio por página en la región Oeste de EE. UU. (Oregón) para un millón de páginas con tablas es de 0,015 USD, y con formularios es de 0,05 USD para un total de 325 USD.

Total de páginas procesadas = 5000 páginas

Precio por página con tabla = 0,015 USD

Precio por página con formulario (par clave-valor) = 0,05 USD

Costo total = 0,015 USD * 5000 + 0,05 USD * 5000 = 75 USD + 250 USD = 325 USD

Ejemplo de precios 4: API para analizar documentos (formularios y tablas)

Digamos que desea extraer el texto, formularios y tablas de dos millones de páginas de formularios de impuestos con la API para analizar documentos. El precio por página en la región Oeste de EE. UU. (Oregón) para un millón de páginas con tablas es de 0,015 USD, y de 0,01 USD por página a partir del millón de páginas. El precio de las páginas con formularios es de 0,05 USD para un millón de páginas, y de 0,04 USD por página a partir de un millón. El costo total sería de 115 000 USD.

Total de páginas procesadas = 2 000 000 páginas

Precio de la página con formulario (par clave-valor) = 0,05 USD para el primer millón y 0,04 USD para el siguiente millón

Costo total = 0,015 USD * 1 000 000 + 0,01 USD * 1 000 000 + 0,05 USD * 1 000 000 + 0,04 USD * 1 000 000 = 15 000 USD + 10 000 USD + 50 000 + 40 000 = 115 000 USD

Ejemplo de precios 5: API para analizar documentos (consultas)

Digamos que desea extraer el texto de 5000 páginas de formularios de hipotecas con la API para analizar documentos. Además, desea extraer 10 puntos de datos específicos de cada página mediante consultas. El precio por página en la región Oeste de EE. UU. (Oregón) para un millón de páginas es de 0,015 USD, para un total de 75 USD.

Total de páginas procesadas = 5000 páginas

Precio por página con Consultas = 0,015 USD

Costo total = 0,015 USD * 5000 = 75 USD

Ejemplo de precios 6: API para analizar documentos (formularios y consultas)

Digamos que desea extraer el texto y los datos de tablas de 5000 páginas de formularios de impuestos con la API para analizar documentos. Además, desea extraer 10 puntos de datos específicos de cada página mediante consultas. El precio por página en la región Oeste de EE. UU. (Oregón) para un millón de páginas con tablas y consultas es de 0,020 USD, y de 0,015 USD por página a partir del millón de páginas. El costo total sería de 100 USD.

Total de páginas procesadas = 5000 páginas

Precio por página con tablas y consultas = 0,020 USD

Costo total = 0,020 USD * 5000 = 100 USD

Ejemplo de precios 7: API para analizar documentos (formularios y consultas)

Digamos que desea extraer el texto y los datos de formularios (pares clave-valor) de 5000 páginas de formularios de seguros con la API para analizar documentos. Además, desea extraer 10 puntos de datos específicos de cada página mediante consultas. El precio por página en la región Oeste de EE. UU. (Oregón) para un millón de páginas con formularios y consultas es de 0,055 USD, y de 0,045 USD por página a partir del millón de páginas. El costo total sería de 275 USD.

Total de páginas procesadas = 5000 páginas

Precio por página con formularios (par clave-valor) y consultas = 0,055 USD

Costo total = 0,055 USD * 5000 = 275 USD

Ejemplo de precios 8: API para analizar documentos (formularios, tablas y consultas)

Digamos que desea extraer el texto, formularios y tablas de dos millones de páginas de talones de pago con la API para analizar documentos. Además, desea extraer 10 puntos de datos específicos de cada página mediante consultas. El precio por página en la región Oeste de EE. UU. (Oregón) para un millón de páginas con tablas, formularios y consultas es de 0,070 USD, y de 0,055 USD por página a partir del millón de páginas. El costo total sería de 125 000 USD.

Total de páginas procesadas = 2 000 000 de páginas 

Precio de la página con tablas, formularios y consultas = 0,070 USD para el primer millón y 0,055 USD para el siguiente millón 

Costo total = 0,070 USD * 1 000 000 + 0,055 USD * 1 000 000 = 70 000 USD + 55 000 USD = 125 000 USD

Ejemplo de precios 9: API para analizar gastos

Supongamos que quiere extraer datos de 100 000 facturas mediante la API para analizar gastos. El precio por página en la región EE. UU. Oeste (Oregón) para 1 millón de páginas es de 0,01 USD y se procesan 100 000 facturas. El costo total sería de 1000 USD. Vea el cálculo a continuación: 

Total de páginas procesadas = 100 000 

Precio por página = 0,01 USD 

Costo total mensual = 0,01 USD * 100 000 = 1000 USD

Ejemplo de precios 10: API para analizar gastos

Supongamos que quiere extraer datos de 1 500 000 facturas mediante la API para analizar gastos. El precio por página en la región EE. UU. Oeste (Oregón) para un millón de páginas es de 0,01 USD por página y de 0,008 USD por página a partir de un millón. El costo total sería de 14 000 USD. Vea el cálculo a continuación: 

Total de páginas procesadas = 1 500 000 

Precio por página = 0,01 USD para el primer millón, y 0,008 USD para las siguientes 500 000 

Costo total mensual = 0,01 USD * 1 000 000 + 0,008 USD * 500 000 = 14 000 USD

Ejemplo de precios 11: API para analizar los ID

Supongamos que quiere extraer información de 100 000 documentos de identidad con la API para analizar los ID. El precio por página en la región Oeste de EE. UU. (Oregón) para 100 000 páginas es de 0,025 USD por página para un máximo de 100 000 páginas. El costo total sería de 2500 USD. 

Total de páginas procesadas = 100 000 

Precio por página = 0,025 USD 

Costo total mensual = 0,025 USD * 100 000 = 2500 USD

Ejemplo de precios 12: API para analizar los ID

Supongamos que quiere extraer información de 600 000 documentos de identidad con la API para analizar los ID. El precio por página en la región Oeste de EE. UU. (Oregón) para 100 000 páginas es de 0,025 USD por página, y de 0,01 USD por página a partir de 100 000. El costo total sería de 7500 USD.

Total de páginas procesadas = 600 000 

Precio por página = 0,025 USD para las primeras 100 000, y 0,01 USD para las siguientes 500 000 

Costo total mensual = 0,025 USD * 100 000 + 0,01 USD * 500 000 = 7500 USD

Consulte las preguntas frecuentes de Amazon Textract

Obtenga más información sobre cómo Amazon Textract extrae texto y datos estructurados prácticamente de cualquier documento.

Más información 
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Registrarse 
Comience a crear en la consola

Comience a crear con Amazon Textract en la consola de administración de AWS.

Regístrese