게시된 날짜: Mar 30, 2022
Amazon Textract는 거의 모든 문서에서 텍스트와 데이터를 손쉽게 추출할 수 있는 기계 학습 서비스입니다. AWS는 고객 피드백을 바탕으로 기본 기계 학습 모델을 지속적으로 개선하여 더 나은 정확성을 제공합니다. 오늘 테이블 및 확인란 감지 기능의 몇 가지 품질 향상을 발표하게 되어 기쁘게 생각합니다.
최신 테이블 모델에서는 병합된 셀 감지 및 열 헤더 식별 기능을 지원합니다. 특히 "Type": "MERGED_CELL"을 통해 AnalyzeDocument-Tables 기능을 사용하여 처리된 문서에서 병합된 셀을 감지하고 "EntityTypes": ["COLUMN_HEADER"] 식별자를 통해 열 헤더를 구성하는 셀을 식별할 수도 있습니다. 더불어, 테이블 기능의 품질이 향상되었다는 기쁜 소식도 전해드립니다. 오늘부터 Textract는 외부 경계, 행 및 열 경계와 테이블 내용을 더 정확하게 탐지합니다. 고객은 이제 대출, 보험, 금융 서비스, 법률, 의료, 에너지 및 공공 부문에서 볼 수 있는 문서 유형 등 다양한 문서 유형 내에서 테이블을 추출할 때 후처리를 해야 하는 수고는 줄어들고 더 높은 정확도 기대할 수 있습니다.
마지막으로 약식 모델 내에서 확인란 감지 기능을 개선했습니다. 이 개선 사항으로 이제 Amazon Textract를 활용하여 양식 필드 내의 확인란에서 손으로 쓴 선택하거나 선택하지 않은 정보를 더 정확하게 감지할 수 있습니다.
시작하려면 Amazon Textract 콘솔에 로그인하여 최신 테이블 및 확인란 감지 기능을 사용해 보세요. Textract 기능에 대해 자세히 알아보려면 Amazon Textract 웹 사이트, 개발자 가이드 또는 리소스 페이지를 참조하세요.