Amazon Textract

거의 모든 문서에서 텍스트와 데이터를 손쉽게 추출
Amazon Textract는 스캔한 문서에서 텍스트와 데이터를 자동으로 추출하여 단순한 OCR(광학 문자 인식)을 넘어 양식과 테이블에서 데이터를 식별, 이해 및 추출하는 완전관리형 기계 학습 서비스입니다.

오늘날 많은 기업이 수동 데이터 입력(느리고 비용이 많이 들며 오류가 발생하기 쉬움) 또는 수동 구성이 필요한 단순한 OCR 소프트웨어(양식이 변경될 때마다 업데이트해야 사용 가능)를 통해 PDF, 테이블, 양식 등 스캔한 문서에서 데이터를 추출합니다.
 
이러한 수동 프로세스를 해결하기 위해 Textract은 기계 학습을 사용하여 모든 유형의 문서를 즉시 읽고 처리함으로써 수동 작업이나 사용자 지정 코드 없이도 텍스트, 양식, 테이블 및 기타 데이터를 정확하게 추출합니다.

Textract를 사용하면 수동 문서 작업을 신속하게 자동화하여 문서 수백만 페이지를 몇 시간 만에 처리할 수 있습니다. 정보가 캡처된 후에는 비즈니스 애플리케이션 내에서 이에 대한 조치를 취해 대출 신청, 세무 서류, 등록 양식 또는 의료비 청구 처리에 필요한 다음 단계를 개시할 수 있습니다. 또한 스마트 검색 인덱스를 생성하거나 Amazon Augmented AI를 통해 인적 검토를 추가하여 미묘하거나 민감한 데이터를 검토할 수 있습니다.

이점

정형 및 비정형 데이터를 빠르고 정확하게 추출

Amazon Textract은 인공 지능을 사용하여 사람이 하듯이 문서를 “읽고” 구성, 훈련 또는 사용자 지정 코드 없이 텍스트뿐만 아니라 테이블, 양식 및 기타 정형 데이터를 추출합니다. Amazon Textract는 문서의 레이아웃 및 페이지 내 주요 요소를 자동으로 감지하고, 모든 내장된 양식 또는 테이블의 데이터 관계를 이해하며, 컨텍스트를 그대로 유지하면서 모든 정보를 추출합니다.

단순한 OCR(광학 문자 인식)을 넘어서

Amazon Textract는 OCR 기술을 사용하여 저렴한 비용으로 구조를 손상시키지 않으면서 양식 레이블 및 값을 식별하고 테이블에서 정보를 추출합니다. 사용한 만큼만 비용을 지불하면 되며 사전 약정이나 장기 계약은 없습니다. 

보안 및 규정 준수

Textract는 Service Organization Control(SOC) 규정, International Organization for Standardization(ISO) 규정, PCI, HIPAA, GPDR을 준수해야 하는 워크로드에 사용할 수 있습니다. 금융, 의료 등의 산업에 종사하는 기업에서는 고객 데이터를 보호하는 보안 프로세스 및 제어에 대한 인사이트를 얻을 수 있습니다. Textract는 AWS PrivateLink를 통해 Amazon Virtual Private Cloud(Amazon VPC)를 지원하여, 공개 인터넷을 사용하지 않고 VPC 내에서 Amazon Textract로 API 호출을 안전하게 보낼 수 있도록 지원합니다.

인적 검토를 손쉽게 구현

Amazon Textract는 Amazon Augmented AI(Amazon A2I)와 직접 통합되므로 문서에서 추출한 텍스트에 대한 인적 검토를 손쉽게 구현할 수 있습니다. 인적 검토 기능을 내장하여 높은 신뢰도의 예측을 얻거나 지속적으로 예측을 감사하기 위해 인적 판단이 필요한 미묘하거나 민감한 워크플로를 관리할 수 있습니다.

What is Amazon Textract(1:49)

사용 사례

스마트 검색 인덱스 생성

문서로부터 구조화된 데이터를 추출하고 스마트 인덱스를 생성하여 수백만 개의 재무제표를 빠르게 검색할 수 있습니다. 예를 들어 대출 회사에서는 Amazon Textract를 사용하여 수백만 개의 스캔된 대출 신청서를 몇 시간 만에 처리하고 추출된 데이터를 Amazon Elasticsearch에 인덱싱 처리할 수 있습니다. 이를 통해 "신청자 이름이 John Doe인 대출 신청 검색" 또는 "이자율이 2%인 계약 검색"과 같은 검색 환경을 생성할 수 있습니다.

자동화된 문서 처리 워크플로 구축

Amazon Textract는 사용자의 개입 없이 양식을 자동 처리하는 데 필요한 입력을 제공할 수 있습니다. 예를 들어 은행에서는 Amazon Textract를 사용하여 대출 신청서를 자동화할 수 있습니다. 문서에 포함된 정보는 대출 승인에 필요한 모든 신원 조회 및 신용도 확인에 사용할 수 있으며, 이를 통해 고객은 수동 검토 및 검증으로 인해 며칠을 기다리는 대신 신청 결과를 바로 확인할 수 있습니다.

문서 아카이브의 규정 준수 유지

Amazon Textract에서 자동으로 데이터 유형을 식별하고 레이블을 형성하므로 정보 제어 관련 규정 준수를 유지하기 쉽습니다. 예를 들어 보험사에서는 Amazon Textract를 사용하여 보호가 필요한 중요 키-값 페어를 자동으로 인식함으로써 청구 양식을 아카이빙하기 전에 검토를 위한 PII(개인 식별 정보)를 자동으로 교정하는 워크플로를 제공할 수 있습니다.

고객 성공 사례

change-healthcare-600x400

선도적인 독립 의료 기술 회사인 Change Healthcare는 미국 의료 시스템에서 임상, 재무 및 환자 참여 결과를 개선하는 데이터 및 분석 기반 솔루션을 제공합니다.

"Change Healthcare는 재무 및 관리 의사 결정의 일정과 품질을 개선함으로써 모든 사람이 부담 없이 이용할 수 있는 의료 서비스를 제공할 수 있다고 생각합니다. 기계 학습 기술을 활용하여 데이터에서 더 많은 것을 얻어내면 이 목표를 달성할 수 있습니다. 그러나 이 정보의 잠재력을 활용하기가 쉬운 것은 아닙니다. 기존의 광학 문자 인식으로는 분석할 수 없는 테이블과 양식 안에 정보가 갇혀 있기 때문입니다. Amazon Textract는 텍스트에 더해 정형 데이터를 검색하는 기능을 사용하여 문서에 대한 이해를 높여줍니다. 이제 이 서비스는 HIPAA를 준수하므로 수백만 개 문서의 정보를 자유롭게 활용하여 환자, 보험사 및 의료 공급자에게 훨씬 더 많은 가치를 제공할 수 있습니다."

Nick Giannasi, EVP 겸 최고 AI 책임자 - Change Healthcare


filevine-600x400

Filevine은 클라우드 기반 사례 및 문제 관리, 문서 관리, 심층 보고 분석 등을 제공하는 법무 전문가를 위한 운영 코어입니다. Filevine은 2015년에 설립된 이후로 빠른 혁신과 수상 경력을 자랑하는 설계에 집중하여, 독립적인 리뷰 사이트에서 최고의 평가를 받았습니다.

"Filevine에서는 매일 수백 건의 문제와 사건 파일이 처리됩니다. 고객에게 업계 최고의 문서 검색 솔루션을 제공하고 싶었기 때문에 Amazon Web Services를 선택했습니다. Amazon Textract는 빠르고, 정확하면서도 확장 가능합니다. Filevine이 규모와 복잡성 측면에서 세계 최대 규모를 자랑하는 법무 조직의 요구 사항을 정확히 해결하는 데 도움이 됩니다. Filevine과 Amazon이 힘을 합친 덕분에 법무 전문가들은 그 어느 때보다 ‘건초 더미에서 바늘 찾는 작업’을 쉽게 해낼 수 있게 되었습니다."

Ryan Anderson, 최고경영자 - Filevine


CD_2018_Primary_Logo_w_TM

ClearDATA의 혁신적인 솔루션 및 서비스 플랫폼은 의료 업계가 매일 더 나은 의료 서비스를 제공하는 데 집중할 수 있도록 데이터 프라이버시 위험으로부터 고객을 보호하고, 데이터 관리를 개선하며, 의료 IT 인프라를 확장합니다.

"기계 학습 기반의 광학 문자 인식 서비스인 AWS Textract가 HIPAA 적격 서비스 목록에 추가되었습니다. 기분이 너무 좋습니다. 보험사와 의료 공급자 간에 공유되는 많은 의료 데이터가 PDF 같은 이미지 기반 파일 안에 갇혀 있습니다. 이제 의료 조직에서는 이 종류의 데이터를 수동으로 처리하는 대신 Amazon Textract 서비스를 사용하여 이전에 기계 판독이 불가능했던 파일에서 의료 데이터를 추출할 수 있습니다. 이 기능은 데이터를 전자 의료 레코드에 통합하거나 데이터 세트에서 PHI를 식별할 수 있는 Amazon Comprehend Medical과 같은 다른 클라우드 기술에 통합할 수 있는 기회를 제공합니다. 앞으로는 이러한 새로운 기술을 사용하여 데이터 액세스를 개선하고, 더 나은 통찰력을 얻고, 비용을 절감하며, 환자 및 회원의 경험을 개선할 수 있는 기회가 더 많아질 것입니다."

Matt Ferrari, 최고 기술 책임자 - ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
Amazon Textract 기능 살펴보기

더 많은 Amazon Textract 기능을 살펴보십시오.

자세히 알아보기 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입하기 
Product-Page_Standard-Icons_03_Start-Building_SqInk
콘솔에서 구축 시작

AWS Management Console에서 Amazon Textract를 사용하여 구축을 시작하십시오.

가입