Amazon Textract công bố bản cập nhật tính năng và độ chính xác cho API DetectDocumentText và AnalyzeDocument
Amazon Textract là một dịch vụ máy học được quản lý, tự động trích xuất văn bản, chữ viết tay và dữ liệu từ mọi tài liệu hoặc hình ảnh. Chúng tôi thường xuyên cải tiến các mô hình máy học cơ bản dựa trên phản hồi của khách hàng nhằm cung cấp độ chính xác cao hơn nữa. Hôm nay, chúng tôi hân hạnh thông báo bản cập nhật tính năng và độ chính xác cho mô hình phát hiện văn bản được sử dụng trong API DetectDocumentText và AnalyzeDocument của Textract.
Bản cập nhật này bổ sung hỗ trợ cho các chỉ số trên, chỉ số dưới và văn bản xoay trong tài liệu. Bản cập nhật cũng bao gồm những cải tiến về độ chính xác nhằm phát hiện văn bản trong các dạng hộp, trích xuất những bộ ký tự nhìn có vẻ tương đồng (ví dụ: '0' với 'O') và các tài liệu có độ phân giải thấp hơn như fax.
Bản cập nhật này hiện có ở khu vực Miền Đông Hoa Kỳ (Ohio, Bắc Virginia), Miền Tây Hoa Kỳ (Bắc California, Oregon), Châu Á Thái Bình Dương (Mumbai, Seoul, Singapore, Sydney), Canada (Miền Trung), Châu Âu (Frankfurt, Ireland, London, Paris, Tây Ban Nha) và AWS GovCloud (Miền Đông Hoa Kỳ, Miền Tây Hoa Kỳ).
Để bắt đầu sử dụng, hãy đăng nhập vào bảng điều khiển Amazon Textract. Để tìm hiểu thêm về các tính năng của Textract, vui lòng truy cập trang web của Amazon Textract, hướng dẫn dành cho nhà phát triển hoặc trang tài nguyên.