게시된 날짜: Jul 27, 2021

모든 문서나 이미지에서 텍스트와 구조화된 데이터를 추출하는 기계 학습 서비스인 Amazon Textract가 이제 인보이스와 영수증에 특화된 지원을 제공합니다. 이런 중요한 문서들은 정해진 디자인 규칙을 따르지 않고 정확히 해석하려면 콘텍스트가 필요하다는 이유로 지금까지 대규모로 처리하기 어려웠습니다. 예를 들어 고객은 인보이스에 ‘공급 업체: Amazon’이라고 표시되어 있지 않아도 Amazon 로고에서 공급 업체 이름을 추출할 필요가 있습니다. 이제 Textract가 있으면 고객은 템플릿이나 구성 작업 없이도 거의 모든 인보이스나 영수증의 상품 또는 서비스 항목별 목록에서 명시적으로 분류된 데이터, 암시적 데이터, 라인 항목을 추출할 수 있습니다.

오늘자로 Amazon Textract에 영수증 및 인보이스 관련 다음 기능이 추가됩니다. 1) 공급 업체 이름 인식 - Amazon Textract는 영수증 상에 ‘공급 업체’라고 명시적으로 분류되어 있지 않더라도 로고에만 표시되어 있다면 공급 업체 이름을 찾을 수 있습니다. 또한 라인 항목의 열 헤더로 분류되어 있지 않은 경우라도 품목, 수량, 가격을 찾아서 추출할 수 있습니다. 2) 다수의 문서에서 출력 내용 통합 - Textract는 인보이스와 영수증에서 데이터를 추출할 때 Keyname과 열 헤더를 표준 분류로 일반화합니다. 예를 들어 ‘인보이스 No.’와 ‘인보이스 번호’와 ‘영수증 #’ 항목이 동일하다고 감지하여 ‘INVOICE_RECEIPT_ID’를 출력하기 때문에 다운스트림 애플리케이션이 여러 문서에서의 출력을 쉽게 비교할 수 있습니다. 3) 열 헤더가 누락된 경우에도 라인 항목 세부 정보 추출 - Textract는 인보이스나 영수증에서 구매한 각 상품의 품목, 수량, 가격을 포함한 라인 항목을 추출합니다. 만약 라인 항목의 표에 열 헤더가 없다면 Textract는 표의 내용에 기반하여 열 헤더가 어떤 의미인지 파악합니다.

고객 사례 확인:

2010년에 설립된 Paymerang은 쉽고 안전하며 수익성이 좋은 기업용 공급 업체 전자 결제 서비스를 제공합니다. Paymerang의 엔터프라이즈 플랫폼 디렉터인 Jason Losh가 드리는 말씀은 다음과 같습니다. “당사는 반복 작업 감소, 공급 업체 전자 결제, 결제 과정에서 현금 리베이트 획득을 통해 미지급금 처리를 단순화할 수 있도록 여러 업종의 고객을 지원합니다. 당사는 HIPAA 적격 서비스인 Amazon Textract를 사용하여 의료 업종의 고객이 특정 로직을 통해 추출 정보를 표준화하지 않고도 인보이스에서 자동으로 데이터를 추출할 수 있도록 돕습니다. 데이터를 추출하여 일관된 표준 필드로 분류하는 Amazon Textract 덕분에 인보이스 레이아웃이 일반적인 패턴과 다른 공급 업체를 사용하는 고객이라도 만족시킬 수 있습니다.”

이 기능에 대한 자세한 내용은 자세한 세부 정보를 담은 설명서와 더불어 AnalyzeExpense라는 새로운 API를 갖춘 Textract를 사용해 인보이스와 영수증을 처리하는 방법을 설명한 블로그 게시물을 참조하세요. 요금 페이지 링크입니다.

AnalyzeExpense는 단계별로 출시됩니다. 7월 26일에 아시아 태평양(싱가포르) 리전, 7월 27일에 유럽(아일랜드), 7월 28일에 아시아 태평양(시드니), 미국 동부(오하이오), 미국 서부(캘리포니아 북부), 7월 29일에 유럽(프랑크푸르트), 유럽(런던), 미국 동부(버지니아 북부), 7월 30일에 아시아 태평양(서울), 아시아 태평양(뭄바이), 캐나다(중부), 유럽(파리), 미국 서부(오레곤Oregon), 8월 2일에 GovCloud(미국 동부), GovCloud (미국 서부) 리전에 출시됩니다.