게시된 날짜: Dec 18, 2019

Amazon Textract는 사용자 지정 구성이나 템플릿 없이 DetectText 또는 AnalyzeDoc API를 사용하여 테이블 및 양식과 같은 텍스트 및 정형 데이터를 쉽고 빠르게 검색할 수 있는 기계 학습 서비스입니다. Amazon Textract 같은 관리형 서비스의 한 가지 이점은 고객이 시간이 지남에 따라 지속적으로 개선된 기능과 성능의 혜택을 누릴 수 있다는 점입니다. 오늘 Amazon Textract가 PCI DSS 인증을 받았다는 소식을 발표하게 되어 정말 기쁩니다. 이제 PCI DSS(Payment Card Industry Data Security Standard) 정보 보안 표준(예: CHD(카드 보유자 데이터) 또는 SAD(민감한 인증 데이터))를 요구하는 모든 워크로드에 대해 Amazon Textract를 사용할 수 있습니다. 또한 AWS는 Amazon Textract에서 테이블 및 양식 기능에 대한 정확성을 높일 수 있는 품질 개성 사항도 공개했으며, 이 기능은 오늘부터 사용할 수 있습니다. 

먼저, 이제 AWS의 테이블 모델은 분할 셀 및 병합 셀(이로 인해 올바른 열 헤더나 행 헤더에 셀 값을 정렬하기 어려워짐)을 포함하는 복잡한 테이블 구조에서 더 효과적으로 작동합니다. 그 다음으로, Amazon Textract는 명시적 경계가 없는 테이블에서도 줄 바꿈된 텍스트(여러 라인에 걸쳐 텍스트가 존재함)를 포함하는 셀의 행과 열을 식별하는 기능이 추가적으로 향상되었습니다. 이제 Amazon Textract는 명시적 경계가 없는 새 행일 때와 대조적으로, 여러 행에 걸쳐 콘텐츠가 포함된 셀을 보다 정확하게 확인할 수 있습니다. 마지막으로, Amazon Textract는 키-값 페어 식별을 위해 더 정확한 결과를 얻을 수 있도록 양식 모델도 개선했습니다. 이러한 혜택은 많은 유형의 문서에 적용되지만, 특히, 동일한 페이지에 테이블 및 키-값 페어가 존재하는 문서에서 그 효과가 더 두드러집니다. 이제 Amazon Textract는 테이블에 포함된 키-값 페어를 올바르게 식별할 수 있습니다. 

여기에서 이러한 업데이트에 대한 자세한 내용을 확인할 수 있습니다.