Amazon Textract анонсирует обновления функций и параметров точности для API DetectDocumentText и AnalyzeDocument
Amazon Textract – это управляемый сервис машинного обучения, который автоматически извлекает рукописный текст и данные из любых документов и изображений. Мы регулярно совершенствуем базовые модели машинного обучения на основе обратной связи, чтобы дополнительно повысить их точность. Сегодня мы рады анонсировать обновления функций и параметров точности модели распознавания текста, используемой в API Textract DetectDocumentText и AnalyzeDocument.
В этом обновлении добавлена поддержка верхних и нижних индексов и повернутого текста при работе с документами. Также в обновление включены улучшенные параметры точности распознавания текста в прямоугольных графах, извлечения визуально сходных наборов символов (например, «0» и «O») и обработки документов с пониженным разрешением, например, факсов.
Это обновление теперь доступно в следующих регионах: Восток США (Огайо, Северная Вирджиния), Запад США (Северная Калифорния, Орегон), Азиатско-Тихоокеанский регион (Мумбаи, Сеул, Сингапур, Сидней), Канада (Центральная), Европа (Франкфурт, Ирландия, Лондон, Париж, Испания) и AWS GovCloud (восток США, запад США).
Чтобы начать, войдите на консоль Amazon Textract. Чтобы узнать больше о возможностях Textract, изучите веб-сайт Amazon Textract, руководство для разработчиков или страницу ресурсов.