게시된 날짜: Nov 2, 2022

Amazon Textract는 문서 또는 이미지에서 텍스트, 필기 및 데이터를 자동으로 추출하는 기계 학습 서비스입니다. AWS는 고객 피드백을 바탕으로 기본 기계 학습 모델을 지속적으로 개선하여 더 나은 정확성을 제공합니다. AWS는 오늘 AnalyzeDocument API를 통해 사용 가능한 텍스트 및 양식 추출 기능의 품질을 개선하는 향상된 기능을 발표했습니다.

이제 Amazon Textract에서는 세금 신고 양식과 출입국 심사 양식 등의 문서에서 흔히 확인할 수 있는 단일 문자 입력용 상자형 양식의 키-값 페어를 더욱 정확하게 추출할 수 있습니다. 이러한 문서에서는 상자의 단어를 캡처하는 방식이 복잡하여 지금까지는 정보를 추출하기가 까다로웠습니다. Textract는 이제 이러한 단일 문자 입력용 상자형 양식 관련 정보를 활용하여 더 높은 정확도로 키-값 페어를 추출할 수 있습니다.

또한 수표에 흔히 사용되는 E13B 글꼴 지원, 은행 문서에 사용되는 국제 은행 계좌 번호의 정확도 개선, 그리고 AnalyzeDocument API를 통해 이메일 주소 등의 긴 단어를 추출하는 기능도 발표되었습니다. 보험, 의료, 은행 같은 업계의 고객은 업무 프로세스에서 이러한 문서를 사용하는데, Textract의 문서 분석 API 사용 시 이번 업데이트의 이점을 자동으로 확인하게 될 것입니다.

이번 업데이트는 10월 31일부터 미국 동부(오하이오, 버지니아 북부), 미국 서부(캘리포니아 북부), 미국 서부(오레곤), 아시아 태평양(뭄바이, 서울, 싱가포르, 시드니), 캐나다(중부), 유럽(프랑크푸르트, 아일랜드, 런던, 파리) 및 AWS GovCloud(미국 동부, 미국 서부) 리전에서 사용할 수 있습니다.

시작하려면 Amazon Textract 콘솔에 로그인하여 이 기능을 사용해 보세요. Textract 기능에 대해 자세히 알아보려면 Amazon Textract 웹 사이트개발자 안내서 또는 리소스 페이지를 참조하세요.