게시된 날짜: Nov 16, 2020

기계 학습 서비스인 Amazon Textract는 문서에서 텍스트와 기타 데이터를 추출하고 양식에서 테이블을 추출합니다. 오늘 2가지 새로운 기능을 발표하게 되었습니다.

  • 이제 Amazon Textract가 의료 양식, 처방전, 소송 서류, 세금 문서, 소득 증빙 서류, 수표, 청구서, 학술 논문 등의 문서에서 필기 텍스트를 인식하는 기능을 지원합니다. Detect Document Text 또는 Analyze Document API를 사용하여, 스캔한 문서의 이미지 또는 PDF를 처리하여 인쇄 텍스트와 필기를 모두 추출할 수 있으므로, 거의 모든 스캔 문서 처리 작업을 자동화할 수 있습니다. 또한, 또 다른 AWS 서비스인 Amazon Augmented AI(Amazon A2I)를 사용하여 기계 학습 예측을 사람이 검토하는 워크플로를 손쉽게 구축할 수 있습니다. Amazon Textract 콘솔에 로그인하여 필기 기능을 사용해보거나 Amazon Machine Learning 히어로 Mike Chambers가 진행하는 새로운 데모를 참조할 수 있습니다. 
  • 현재 Amazon Textract는 스페인어, 독일어, 이탈리아어, 포르투갈어, 독일어로 인쇄된 텍스트가 있는 문서의 처리를 지원합니다. 이들 언어의 문서를 텍스트 추출을 위해 전송하면 Amazon Textract가 자동으로 정보를 감지하여 추출합니다.

또한 이제 AWS EU(파리) 리전에서도 Amazon Textract를 사용할 수 있게 되었습니다. 시작하려면 Amazon Textract 콘솔에 로그인하여 필기 문서를 테스트해 보고 새로운 언어 지원을 살펴보세요. Textract 기능에 대해 자세히 알아보려면 Amazon Textract 웹 사이트개발자 안내서 또는 리소스 페이지를 참조하세요.