Amazon Textract

사실상 모든 문서에서 텍스트와 데이터를 손쉽게 추출

Amazon Textract는 스캔한 문서에서 텍스트 및 데이터를 자동으로 추출하는 서비스입니다. Amazon Textract는 또한 단순한 OCR(광학 문자 인식)을 넘어 양식의 필드 콘텐츠와 테이블에 저장된 정보를 식별합니다.

현재 여러 회사에서는 느리고 비용이 많이 드는 수동 데이터 입력을 통해 또는 사용자 지정이 어려운 단순한 OCR(광학 문자 인식) 소프트웨어를 통해 문서 및 양식으로부터 데이터를 추출합니다. 각 문서 및 양식에 대한 규칙 및 워크플로는 여러 양식을 처리해야 하는 경우 폼에 적용된 각각의 변경 사항을 포함하여 자주 하드 코딩 및 업데이트됩니다. 양식이 규칙에서 벗어나는 경우 출력은 종종 뒤죽박죽되고 유용성이 떨어지게 됩니다.

Amazon Textract는 기계 학습을 사용하여 사실상 모든 유형의 문서를 즉시 “읽고”, 수동 작업 또는 사용자 지정 코드 없이 텍스트와 데이터를 정확하게 추출함으로써 이러한 문제를 해결합니다. Textract를 사용하면 문서 워크플로를 신속하게 자동화하여 문서 수백만 페이지를 몇 시간 만에 처리할 수 있습니다. 정보가 캡처된 후에는 비즈니스 애플리케이션 내에서 이에 대한 조치를 취해 대출 신청 또는 의료비 청구 처리에 필요한 다음 단계를 개시할 수 있습니다. 추가로 스마트 검색 인덱스를 생성하고, 자동화된 승인 워크플로를 구축하고, 교정이 필요할 수 있는 데이터를 플래그 지정해 문서 아카이브 규칙에 관한 규정 준수를 더욱 원활하게 유지할 수 있습니다.

Amazon Textract 소개

이점

빠르고 정확한 데이터 추출

Amazon Textract를 사용하면 문서 및 양식으로부터 데이터를 빠르고 정확하게 추출할 수 있습니다. Amazon Textract는 문서의 레이아웃 및 페이지 내 주요 요소를 자동으로 감지하고, 모든 내장된 양식 또는 테이블 사이의 데이터 관계를 이해하며, 온전한 컨텍스트로 모든 내용을 추출합니다. 따라서 애플리케이션에서 추출된 데이터를 바로 사용하거나 사이에 수많은 복잡한 코드 없이도 데이터베이스에 이를 저장할 수 있습니다.



코드 또는 템플릿을 유지 관리할 필요가 없음

Amazon Textract의 사전 교육된 기계 학습 모델을 사용하면 데이터 추출에 필요한 코드를 작성할 필요가 없습니다. 이 모델이 이미 송장, 영수증, 계약, 세무 서류, 판매 주문, 등록 양식, 혜택 신청, 보험 청구, 정책 문서 등을 포함한 모든 사실상 모든 업계의 수천만 가지 문서를 통해 교육되었기 때문입니다. 더는 수령할 모든 문서 또는 양식에 대한 코드를 유지 관리하거나 시간에 따른 페이지 레이아웃의 변화에 대해 걱정할 필요가 없습니다.

문서 처리 비용 절감

Amazon Textract의 텍스트 추출 API를 통해 1,000페이지당 1.50 USD의 비용으로 문서를 처리할 수 있습니다. 1년에 몇백 장 또는 몇백만 장의 문서를 처리하는지와는 무관하게 Amazon Textract는 매우 낮은 가격으로 OCR 및 구조화된 데이터 추출(양식 및 테이블)을 제공하며, 사용자는 사용한 만큼만 지불하면 됩니다. 사전 약정이나 장기 계약이 없습니다.

사용 사례

스마트 검색 인덱스 생성

문서로부터 구조화된 데이터를 추출하고 Amazon Elasticsearch Service를 사용하여 스마트 인덱스를 생성하여 수백만 개의 재무제표에서 빠른 검색이 가능합니다. 예를 들어 대출 회사에서 Amazon Textract를 사용하여 수백만 개의 스캔된 대출 신청서를 몇 시간 만에 처리하고 추출된 데이터를 Amazon Elasticsearch에 인덱싱 처리할 수도 있습니다. 이를 통해 “신청자 이름이 John Doe인 대출 신청 검색” 또는 “이자율이 2%인 계약 검색”과 같은 검색 환경을 생성할 수 있습니다.

자동화된 문서 처리 워크플로 구축

Amazon Textract는 사용자의 개입 없이 양식을 자동 처리하는 데 필요한 입력을 제공할 수 있습니다. 예를 들어 은행에서 대출 신청 PDF 파일을 읽을 코드를 작성할 수 있습니다. 문서에 포함된 정보는 대출 승인에 필요한 모든 신원 조회 및 신용도 확인에 사용할 수 있으며, 이를 통해 고객은 수동 검토 및 검증으로 인해 며칠을 기다리는 대신 신청 결과를 바로 확인할 수 있습니다.

문서 아카이브의 규정 준수 유지

Amazon Textract에서 자동으로 데이터 유형을 식별하고 레이블을 형성하므로 정보 제어 관련 규정 준수를 유지하기 쉽습니다. 예를 들어 보험사에서 Amazon Textract를 사용하여 보호가 필요한 중요 키-값 페어를 자동으로 인식함으로써 청구 양식을 아카이빙하기 전에 검토를 위한 PII(개인 식별 정보)를 자동으로 교정하는 워크플로를 제공할 수 있습니다.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Amazon Textract 기능 살펴보기

Amazon Textract에서 키-값 페어를 감지하고, 테이블 형식 데이터를 보존하는 방법 등을 자세히 알아보십시오.

자세히 알아보기 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입하기 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Amazon Textract 평가판 가입하기

평가판에 가입하여 Amazon Textract를 통한 예측 생성을 시작해 보십시오.

가입하기