Amazon Textract
Автоматическое извлечение печатного и рукописного текста, элементов макета и данных из любых документовПреимущества Amazon Textract
Amazon Textract – сервис машинного обучения (МО), который автоматически извлекает печатный и рукописный текст, элементы макета и данные из сканированных документов. Этот процесс выходит за рамки простого оптического распознавания символов (OCR) и дает возможность идентифицировать, понимать и извлекать конкретные данные из документов. Сегодня многие компании получают данные из сканированных документов (например, PDF-файлов, изображений, таблиц и форм) вручную или с помощью простого программного обеспечения для оптического распознавания текста, которому требуется ручная настройка и, зачастую, обновление при изменении формы. Чтобы устранить дорогостоящую ручную обработку, Amazon Textract читает и обрабатывает любые типы документов с помощью машинного обучения, точно извлекая печатный и рукописный текст, таблицы и другие данные, при этом ручная работа не требуется. Вне зависимости от того, автоматизируете ли вы процесс выдачи кредитов или извлекаете данные из счетов и чеков, можно быстро настроить автоматическую обработку документов с помощью одной из наших предварительно обученных или пользовательских функций. Amazon Textract предоставляет возможность настраивать предварительно обученные функции в соответствии с потребностями в обработке документов вашей компании. Amazon Textract может извлечь данные всего за несколько минут, а не часов или дней.