Amazon Textract는 스캔한 문서에서 텍스트, 필기 및 데이터를 자동으로 추출하는 기계 학습(ML) 서비스입니다. 단순한 광학 문자 인식(OCR) 이상으로 양식 및 표의 데이터를 식별하고 이해하며 추출합니다. Amazon Textract에서는 사용한 만큼만 비용을 지불하면 됩니다. 최소 요금 및 선불 약정은 없습니다. Amazon Textract 요금은 추출하는 데이터(예: 텍스트, 테이블이 있는 텍스트, 양식 데이터, 쿼리 또는 프로세스 인보이스 및 신분 증명서)에 관계없이 처리된 페이지에 대해서만 부과됩니다. 페이지 및 Amazon Textract의 허용 가능한 사용에 대한 추가 세부 정보는 FAQ를 참조하세요.

Amazon Textract에는 Detect Document Text API, Analyze Document API, Analyze Expense API, Analyze ID API, Analyze Lending API의 5가지 API가 있습니다.

Detect Document Text API는 OCR 기술을 사용하여 문서에서 텍스트 및 필기를 추출합니다.

Analyze Document API는 양식, 테이블, 쿼리, 서명의 4가지 기능이 있습니다. 사용자는 양식, 테이블, 쿼리, 서명을 자유롭게 조합하여 유연하게 호출할 수 있습니다.

  • Analyze Document API를 양식에 사용하는 경우 키-값 페어(‘성’과 관련 값: ‘Jane Smith’)와 같은 데이터가 추출됩니다. 또한 이 API는 OCR 기술을 사용하여 문서에서 모든 텍스트 및 필기를 추출합니다.
  • Analyze Document API를 테이블에 사용하는 경우 행과 열로 구성된 테이블 또는 테이블 데이터가 추출됩니다. 또한 이 API는 OCR 기술을 사용하여 문서에서 모든 텍스트 및 필기를 추출합니다.
  • Analyze Document API를 쿼리에 사용하면 문서에서 필요한 정보를 유연하게 지정하고(예: ‘고객 이름은?’) 해당 데이터(예: ‘Jane Doe’)를 응답의 일부로 받을 수 있습니다. 문서의 데이터 구조나 서로 다른 형식 및 버전의 문서에서 다르게 기술된 데이터에 대해 걱정할 필요가 없습니다. 또한 이 API는 OCR 기술을 사용하여 문서에서 모든 텍스트 및 필기를 추출합니다.
  • 사용자 지정 쿼리용 Analyze Document API를 사용하면 비즈니스별 문서에 대한 사용자 지정 쿼리 기능을 호출할 수 있습니다. AWS Console을 사용하여 어댑터를 훈련하고 Analyze Document API 요청의 어댑터 식별자를 사용하여 사용자 지정 쿼리를 사용할 수 있습니다.
  • Analyze Document API를 서명에 사용하는 경우 문서 또는 이미지의 자필 서명, 전자 서명, 이니셜을 감지하는 기능을 사용할 수 있습니다. 또한 이 API는 OCR 기술을 사용하여 문서에서 모든 텍스트 및 필기를 추출합니다.

 

Analyze ID API는 기계 학습을 사용하여 미국 여권, 운전 면허증 및 기타 ID와 같은 신분 문서의 컨텍스트를 이해합니다. 만료일 및 생년월일과 같은 특정 정보를 자동으로 추출하고 이름 및 주소와 같은 암시 정보를 지능적으로 식별하고 추출할 수 있습니다. 각 ID 이미지는 단일 페이지로 간주됩니다.
 
Analyze Lending API는 다양한 모기지 관련 애플리케이션 문서에서 정보 분류 및 추출을 자동화하는 모기지 문서 처리 특화 API입니다. Analyze Lending 기계 학습 모델은 일반적인 모기지 애플리케이션 패키지에서 볼 수 있는 다양한 문서 유형으로 사전 훈련되었습니다. Analyze Lending은 결과를 정확하게 분류, 분할, 추출하고 페이지의 서명 감지 여부를 포함한 결과 요약을 제공합니다.
 

맞춤형 견적 요청

볼륨이 많은 사용 사례의 경우 영업 팀에 문의하여 맞춤형 가격 제안서를 요청하세요.

프리 티어

AWS 프리 티어의 일부로 Amazon Textract를 무료로 시작할 수 있습니다. 프리 티어는 3개월간 지속되며 신규 AWS 고객에게 제공되는 최대 혜택은 다음과 같습니다.

Detect Document Text API: 월 1,000페이지
Analyze Document API:

  • 서명 기능만 사용 시 월 1,000페이지
  • 양식, 표, 레이아웃 기능 사용 시 월 100페이지
  • 쿼리, 양식 + 쿼리, 테이블 + 쿼리, 양식 + 테이블 + 쿼리에 대해 각각 월 100페이지
  • 사용자 지정 쿼리에는 프리 티어가 없습니다.

Analyze Expense API: 월 100페이지

Analyze ID API: 월 100페이지

Analyze Lending API: 월 2,000페이지

Amazon Textract API 요금

사전 훈련된 기능

*Analyze Document API 출력에는 선택한 기능 유형과 관계없이 OCR이 포함됨
*Analyze Expense 및 Analyze ID API에는 출력에 OCR이 포함됨

사전 훈련된 기능 + 사용자 지정된 기능

요금 예(프리 티어를 초과한 경우)

요금 예 1 - Detect Document Text API

Detect Document Text API를 사용하여 100,000페이지의 연구 보고서에서 텍스트를 추출한다고 가정합니다. 미국 서부(오레곤) 리전에서 처음 1백만 페이지의 페이지당 요금은 0.0015 USD이므로 150 USD입니다.

처리된 총 페이지 수 = 100,000

페이지당 요금 = 0.0015 USD

월별 총 요금 = 0.0015 USD * 100,000 = 150 USD

요금 예 2 - Detect Document Text API

Detect Document Text API를 사용하여 2백만 페이지의 연구 보고서에서 텍스트를 추출한다고 가정합니다. 미국 서부(오레곤) 리전에서 페이지당 요금은 처음 1백만 페이지까지는 0.0015 USD이고 1백만 이후에는 0.0006 USD이므로 2백만 페이지를 처리할 경우 총 비용은 2,100 USD입니다.

처리된 총 페이지 수 = 2,000,000

페이지당 요금 = 처음 1백만 개는 0.0015 USD이며 1백만 개 이후는 0.0006 USD

월별 총 요금 = 0.0015 USD * 1,000,000 + 0.0006 USD * 1,000,000 = 1,500 USD + 600 USD = 2,100 USD

요금 예 3 - Analyze Document API – 양식 및 테이블

Analyze Document API를 사용하여 5,000페이지의 세금 양식에서 텍스트 및 구조화된 데이터를 추출한다고 가정합니다. 미국 서부(오레곤) 리전에서 테이블이 있는 1백만 페이지에 대한 요금은 0.015 USD, 양식이 있는 경우에는 0.05 USD이므로 총 요금은 325 USD입니다.

처리된 총 페이지 수 = 5,000페이지

테이블이 있는 페이지의 요금 = 0.015 USD

양식(키-값 페어)이 있는 페이지의 요금 = 0.05 USD

총 요금 = 0.015 USD * 5,000 + 0.05 USD * 5,000 = 75 USD + 250 USD = 325 USD

요금 예 4 - Analyze Document API – 양식 및 테이블

Analyze Document API를 사용하여 2백만 페이지의 세금 양식에서 텍스트, 형식 및 테이블을 추출한다고 가정합니다. 미국 서부(오레곤) 리전에서 테이블이 있는 1백만 페이지에 대한 요금은 0.015 USD, 1백만 페이지 이후에는 0.01 USD입니다. 양식이 있는 페이지는 1백만 페이지까지는 0.05 USD, 1백만 페이지를 넘기면 이 후 페이지당 0.04 USD입니다. 총 비용은 115,000 USD입니다.

처리된 총 페이지 수 = 2,000,000페이지

양식(키-값 페어)이 있는 페이지당 요금 = 처음 1백만 페이지는 페이지당 0.05 USD, 1백만 페이지 초과 시에는 0.04 USD

총 요금 = 0.015 USD * 1,000,000 + 0.01 USD * 1,000,000 + 0.05 USD * 1,000,000 + 0.04 USD * 1,000,000 = 15,000 USD + 10,000 USD + 50,000 + 40,000 = 115,000 USD

요금 예 5 - Analyze Document API – 쿼리

Analyze Document API를 사용하여 5,000페이지의 모기지 양식에서 텍스트를 추출한다고 가정합니다. 또한 각 페이지에서 쿼리를 통해 10개의 특정 데이터 포인트를 추출하려고 합니다. 미국 서부(오레곤) 리전에서 1백만 페이지에 대한 요금은 0.015 USD이고 테이블의 경우 75 USD입니다.

처리된 총 페이지 수 = 5,000페이지

쿼리가 있는 페이지당 요금 = 0.015 USD

총 요금 = 0.015 USD * 5,000 = 75 USD

요금 예 6 - Analyze Document API – 양식, 테이블, 쿼리

Analyze Document API를 사용하여 2백만 페이지의 급여 명세서에서 텍스트, 양식 및 테이블을 추출한다고 가정합니다. 또한 각 페이지에서 쿼리를 통해 10개의 특정 데이터 포인트를 추출하려고 합니다. 미국 서부(오레곤) 리전에서 테이블, 양식 및 쿼리가 있는 1백만 페이지에 대한 요금은 0.070 USD이고 1백만 페이지 이후에는 0.055 USD입니다. 총 비용은 125,000 USD입니다.

처리된 총 페이지 수 = 200만 페이지 

테이블, 양식 및 쿼리가 있는 페이지당 요금 = 처음 1백만 페이지는 0.070 USD, 1백만 이후에는 0.055 USD 

총 요금 = 0.070 USD * 1,000,000 + 0.055 USD * 1,000,000 = 70,000 USD + 55,000 USD = 125,000 USD

요금 예 7 - Analyze Document API - 양식 및 쿼리

Analyze Document API를 사용하여 5,000페이지의 세금 양식에서 텍스트 및 테이블 데이터를 추출한다고 가정합니다. 또한 각 페이지에서 쿼리를 통해 10개의 특정 데이터 포인트를 추출하려고 합니다. 미국 서부(오레곤) 리전에서 테이블 및 쿼리가 있는 1백만 페이지에 대한 요금은 0.020 USD이고 1백만 페이지 이후에는 0.015 USD입니다. 총 비용은 100 USD입니다.

처리된 총 페이지 수 = 5,000페이지

테이블 및 쿼리가 있는 페이지의 요금 = 0.020 USD

총 요금 = 0.020 USD * 5,000 = 100 USD

요금 예 8 - Analyze Document API - 서명

Analyze Document API - 서명 기능 유형을 사용하여 서명을 감지하고 100,000페이지의 모기지 문서에서
원시 텍스트를 추출한다고 가정합니다. 미국 서부(오레곤) 리전에서 첫 1백만 페이지에 대한 페이지당 요금은 0.0035 USD이므로 총 비용은
350 USD입니다.
처리된 총 페이지 수 = 100,000
페이지당 요금 = 0.0035 USD
월별 총 요금 = 0.00035 USD * 100,000 = 350 USD

요금 예 9 - Analyze Document API – 서명

Analyze Document API - 서명 기능 유형을 사용하여 서명을 감지하고 500만 페이지의 모기지 문서에서
원시 텍스트를 추출한다고 가정합니다. 미국 서부(오레곤) 리전에서 첫 1백만 페이지에 대한 페이지당 요금은 0.00035 USD이므로, 총 비용은 20 USD입니다.
처리된 총 페이지 수 = 5000,000
처음 1백만 페이지에 대한 페이지당 요금 = 0.0035 USD *1,000,000 = 3,500 USD
다음 4백만 페이지에 대한 페이지당 요금 = 0.0014 USD * 4,000,000 = 5,600 USD
총 요금 = 3500 USD + 5600 USD = 9100 USD

요금 예 10 - Analyze Expense API

Analyze Expense API를 사용하여 100,000개 인보이스에서 데이터를 추출한다고 가정합니다. 미국 서부(오레곤) 리전에서 페이지당 요금은 1백만 페이지까지 0.01 USD이고 100,000개 인보이스을 처리합니다. 총 비용은 1,000 USD입니다. 아래 계산을 참조하세요. 

처리된 총 페이지 수 = 100,000 

페이지당 요금 = 0.01 USD 

월별 총 요금 = 0.01 USD * 100,000 = 1,000 USD

요금 예 11 - Analyze Expense API

Analyze Expense API를 사용하여 1,500,000개 인보이스에서 데이터를 추출한다고 가정합니다. 미국 서부(오레곤) 리전에서 페이지당 요금은 1백만 페이지까지는 0.01 USD, 1백만 페이지 이후에는 0.008 USD입니다. 총 비용은 14,000 USD입니다. 아래 계산을 참조하세요. 

처리된 총 페이지 수 = 1,500,000 

페이지당 요금 = 처음 1백만 개는 0.01 USD, 다음 500,000개는 0.008 USD 

월별 총 요금 = 0.01 USD * 1,000,000 + 0.008 USD * 500,000 = 14,000 USD

요금 예 12 - Analyze ID API

Analyze ID API를 사용하여 100,000개의 신원 증명 문서에서 정보를 추출하려고 한다고 가정해 보겠습니다. 미국 서부(오레곤) 리전에서 100,000페이지에 대한 페이지당 가격은 최대 100,000페이지에 대해 페이지당 0.025 USD입니다. 총 비용은 2,500 USD입니다. 

처리된 총 페이지 수 = 100,000 

페이지당 요금 = 0.025 USD 

월별 총 요금 = 0.025 USD * 100,000 = 2,500 USD

요금 예 13 - Analyze ID API

Analyze ID API를 사용하여 600,000개의 신원 증명 문서에서 정보를 추출하려고 한다고 가정해 보겠습니다. 미국 서부(오레곤) 리전에서 페이지당 요금은 100,000 페이지까지는 0.025 USD, 100,000 페이지 초과 시에는 0.01 USD입니다. 총 비용은 7,500 USD입니다.

처리된 총 페이지 수 = 600,000

페이지당 요금 = 처음 100,000페이지는 0.025 USD, 다음 500,000페이지는 0.01 USD

월별 총 요금 = 0.025 USD * 100,000 + 0.01 USD * 500,000 = 7,500 USD

요금 예 14 - Analyze Lending API

Analyze Lending API를 사용하여 200,000개의 모기지 대출 문서에서 정보를 추출하려 한다고 가정해 보겠습니다. 미국 서부(오레곤) 리전에서 페이지당 요금은 1백만 페이지까지는 0.07 USD입니다. 사용자가 처리한 200,000페이지 중 Analyze Lending에서 지원하는 문서 유형에 분류 및 추출 작업을 수행하였고, 그 결과 100,000페이지에 대한 분류 및 추출 작업을 완료했습니다. 100,000페이지에 대한 총 비용은 7,000 USD입니다.

처리된 총 페이지 수 = 200,000

분류 및 추출을 지원하는 총 페이지 수 = 100,000 

페이지당 요금 = 0.07 USD

월별 총 요금 = 0.07 USD * 100,000 = 7,000 USD

요금 예 15 - Analyze Lending API

Analyze Lending API를 사용하여 2,000,000페이지의 모기지 대출 문서에서 정보를 추출하려 한다고 가정해 보겠습니다. 미국 서부(오레곤) 리전에서 페이지당 요금은 1백만 페이지까지는 0.07 USD, 1백만 페이지 초과 시에는 0.055 USD입니다. 사용자가 처리한 2,000,000페이지 중 Analyze Lending에서 지원하는 문서 유형에 분류 및 추출 작업을 수행하였고, 그 결과 1,200,000페이지에 대한 분류 및 추출 작업을 완료했습니다. 1,200,000페이지에 대한 총 비용은 81,000 USD입니다.

처리된 총 페이지 수 = 2,000,000

분류 및 추출을 지원하는 총 페이지 수 = 1,200,000

페이지당 요금 = 처음 1백만 페이지는 0.07 USD, 다음 200,000페이지는 0.055 USD

월별 총 요금 = 0.07 USD * 100만 + 0.055 USD * 20만 = 8만 1,000 USD

요금 예 16 - Analyze Document API - 레이아웃 및 테이블

Analyze Document API를 사용하여 200만 페이지의 재무 보고서에서 레이아웃과 테이블을 추출해야 합니다. 테이블 기능과 함께 사용하면 레이아웃을 무료로 사용할 수 있습니다. 미국 서부(오레곤) 리전의 테이블 요금은 1개월간 처음 100만 페이지의 경우 페이지당 0.015 USD이고 1개월간 100만 페이지를 초과하는 페이지의 경우 페이지당 0.010 USD입니다.

처리된 총 페이지 수 = 200만 페이지

처음 100만 페이지 요금 = 0.015 USD * 100만 = 1만 5,000 USD

다음 100만 페이지 요금 = 0.010 USD * 100만 = 1만 USD

총 요금 = 2만 5,000 USD

요금 예 17 - Analyze Document API - 사용자 지정 쿼리

사용자 지정 쿼리를 사용하여 500만 페이지에서 데이터를 추출해야 합니다. 미국 서부(오레곤) 리전의 요금은 1개월간 처음 100만 페이지의 경우 페이지당 0.025 USD이고 1개월간 100만 페이지를 초과하는 페이지의 경우 페이지당 0.015 USD입니다.

처리된 총 페이지 수 = 500만 페이지

처음 100만 페이지 요금 = 0.025 USD * 100만 = 2만 5000 USD

다음 400만 페이지 요금 = 0.015 USD * 400만 = 6만 USD

총 요금 = 8만 5,000 USD

요금 예 18 - Analyze Document API - 사전 훈련된 양식 및 사용자 지정 쿼리

사전 훈련된 양식 및 사용자 지정 쿼리를 사용하여 200만 페이지에서 데이터 포인트를 추출해야 합니다. 미국 서부(오레곤) 리전의 요금은 1개월간 처음 100만 페이지의 경우 페이지당 0.065 USD이고 1개월간 100만 페이지를 초과하는 페이지의 경우 페이지당 0.050 USD입니다.

처리된 총 페이지 수 = 200만 페이지

처음 100만 페이지 요금 = 0.065 USD * 100만 = 6만 5000 USD

다음 100만 페이지 요금 = 0.050 USD * 100만 = 5만 USD

총 요금 = 11만 5,000 USD

Amazon Textract FAQ 살펴보기

Amazon Textract가 거의 모든 문서에서 텍스트 및 구조화된 데이터를 추출하는 방법에 대해 자세히 알아보십시오.

자세히 알아보기 
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입 
콘솔에서 구축 시작

AWS Management Console에서 Amazon Textract를 사용하여 구축을 시작하십시오.

가입하기