Amazon Comprehend는 자연어 처리, 개인 식별 정보(PII) 감지 및 편집, 사용자 지정 분류 및 엔터티 감지와 주제 모델링을 제공하여 원시 텍스트를 분석하는 광범위한 애플리케이션 및 일부 API를 통해 PDF 및 Word 등의 문서 형식을 사용할 수 있게 해줍니다.
- 자연어 처리: 엔터티 인식, 감정 분석, 구문 분석, 핵심 문구 추출, 언어 감지를 위한 Amazon Comprehend API는 자연어 텍스트에서 인사이트를 추출하는 데 사용할 수 있습니다. 이 요청은 문자 100개로 된 유닛으로 측정하며(1개 유닛 = 문자 100개), 요청당 3개 유닛(문자 300개)에 대한 최소 요금이 부과됩니다.
- 개인 식별 정보(PII): PII 탐지 API는 문서에서 선택한 개인 식별 정보("PII") 엔터티의 위치를 찾고 교정된 문서 버전을 생성하는 데 사용할 수 있습니다. PII 포함 API는 문서에 선택한 PII가 포함되었는지 여부를 알려줍니다. 이 요청도 문자 100개로 된 유닛으로 측정하며(1개 유닛 = 문자 100개), 요청당 3개 유닛(문자 300개)에 대한 최소 요금이 부과됩니다.
- 사용자 지정 이해: 사용자 지정 분류 및 엔터티 API는 사용자 지정 NLP 모델을 훈련하여 텍스트를 분류하고 사용자 지정 엔터티를 추출할 수 있습니다. 비동기식 추론 요청은 문자 100개로 된 유닛으로 측정하며, 요청당 3개 유닛(문자 300개)에 대한 최소 요금이 부과됩니다. 모델 훈련에는 시간당 3 USD(초당 과금), 사용자 지정 모델 관리에는 월별 0.50 USD가 부과됩니다. 동기식 사용자 지정 분류 및 엔터티 추론 요청의 경우 적절한 처리량의 엔드포인트를 프로비저닝합니다. 엔드포인트를 시작한 시점부터 삭제한 시점까지 요금이 청구됩니다.
- 주제 모델링: 주제 모델링은 Amazon S3에 저장된 문서 모음에서 관련 용어 또는 주제를 식별합니다. 모음에서 가장 보편적인 주제를 식별하고, 이를 그룹으로 분류한 후, 어떤 문서가 어느 주제에 속하는지 매핑합니다. 작업당 처리된 문서의 총 크기를 기준으로 요금이 부과됩니다. 처음 100MB에 대해서는 정액 요금이 부과됩니다. 100MB를 초과하면 MB당 요금이 부과됩니다.
- 신뢰와 안전(신규): Comprehend의 유해성 검출 API를 사용하여 텍스트에서 유해한 콘텐츠를 검출할 수 있습니다. 마찬가지로, Comprehend 프롬프트 안전 분류 기능을 사용하여 대규모 언어 모델 및 애플리케이션에 입력되는 안전하지 않은 입력 프롬프트를 감지할 수 있습니다. 이 요청은 문자 100자 단위로 측정되며(1단위 = 100자), 요청당 3단위(300자)에 대한 최소 요금이 부과됩니다.
- Amazon Comprehend Medical 요금은 여기에서 자세히 알아보세요.
- AWS 요금 계산기를 사용해 비용을 추산할 수 있습니다.
- 모든 API의 요금을 보려면 아래 리전 선택기에서 미국 동부(버지니아 북부) 리전을 선택하세요.
Amazon Comprehend API를 통해 비정형, 원시 텍스트 및 일부 API를 통해 PDF 및 Word 문서 등의 다른 텍스트 파일을 모두 처리할 수 있습니다.
추론 요청은 문자 100개로 된 유닛으로 측정하며, 요청당 3개 유닛(문자 300개)에 대한 최소 요금이 부과됩니다.
추론 요청은 문자 100개로 된 유닛으로 측정하며, 요청당 3개 유닛(문자 300개)에 대한 최소 요금이 부과됩니다.
엔드포인트는 초 단위로 청구되며 최소 청구 시간은 60초입니다. 문서를 전혀 분석하지 않더라도 엔드포인트를 시작한 시점부터 삭제한 시점까지 요금이 계속 발생합니다.
추론 유닛(IU) 하나는 관리형 엔드포인트에서 초당 100자의 처리량을 제공합니다. 추가 IU를 프로비저닝하여 처리량을 늘릴 수 있습니다. IU 하나당 초당 0.0005 USD의 비용이 발생합니다.
*스캔한 PDF 문서의 텍스트를 추출하기 위해 Amazon Textract 문서 텍스트 탐지 API를 호출합니다.
처음 100MB
100MB 초과 시 MB당
주제 모형화 작업당 처리된 문서의 총 크기를 기준으로 요금이 부과됩니다. 처음 100MB에 대해서는 정액 요금이 부과됩니다. 100MB를 초과하면 MB당 요금이 부과됩니다.
Amazon Comprehend는 매월 API당 5만 텍스트 단위(500만자)를 포함한 프리 티어를 제공합니다.
적격 API에는 핵심 문구 추출, 감정, 표적 감정, 엔터티 인식, 언어 감지, 이벤트 감지, 구문 분석, PII 감지, PII 포함 및 프롬프트 안전 분류가 포함됩니다.
참고: 사용자 지정 Comprehend(사용자 지정 엔터티 및 사용자 지정 분류)는 프리 티어를 제공하지 않습니다. 여기에는 모델 훈련, 추론 및 모델 관리가 포함됩니다.
Amazon Comprehend 프리 티어는 AWS 기존 및 신규 고객 모두에게 첫 번째 Amazon Comprehend 요청을 시작한 날로부터 12개월 동안 제공됩니다.
Amazon Comprehend 요금 예제
예 1 - 고객 의견 분석
Amazon Comprehend를 사용해 온라인 상점의 고객 의견을 분석하는 애플리케이션을 구축했다고 가정해 보겠습니다. 10,000개의 고객 의견을 받았고, 의견당 문자 수는 550개이며, 서비스를 사용한 지 2년째입니다.
총 요금 계산:
각 요청의 크기 = 문자 550개
요청당 유닛 수 = 6
총 유닛: 10,000(요청) x 6(요청당 유닛) = 60,000
유닛당 요금 = 0.0001 USD
총 비용 = [단위 수] x [단위당 비용] = 60,000 x 0.0001 USD= 6.00 USD
예 2 - 주제별 문서 분류
총 240MB의 연구 문서 세트가 있고 이를 주제별로 분류하고 고객의 관심사에 따라 문서를 추천한다고 가정해 보겠습니다. 또한, 서비스를 사용한 지 2년째라서 프리 티어에 해당하지 않습니다.
총 요금 계산:
처리한 총 메가바이트 = 240
1 USD의 정액 요금으로 청구되는 메가바이트 = 100
0.004 USD/MB로 청구되는 메가바이트 = 140 [240-100]
작업의 총 비용 = 1.00 USD + [140 x 0.004 USD] = 1.00 USD + 0.56 USD= 1.56 USD
예 3 - Custom Classification API를 사용하여 고객 피드백 분류
웹 사이트에서 제공되는 새로운 고객 피드백을 자동으로 체계화하도록 분류자를 훈련한다고 가정해 보겠습니다. 1분마다 고객 10명이 피드백을 입력하고 각 피드백은 300자 길이입니다. 사용자 지정 모델을 훈련시키는 데 1시간이 걸리고, 이 모델을 한 달간 유지할 계획입니다. 따라서 모델 훈련 비용은 3 USD이며 모델 저장 비용은 월간 0.5 USD입니다. 또한, 서비스를 사용한 지 2년째라서 프리 티어에 해당하지 않습니다.
피드백을 비동기식으로 분류하려면 문서의 글자 수를 기준으로 요금을 지불하면 됩니다. 실시간으로 분류하려면 사용 사례를 처리하기에 충분한 처리량을 갖춘 엔드포인트를 프로비저닝하고 엔드포인트가 가동되는 시간에 대해 요금을 지불하면 됩니다.
비동기식 분류의 추론 비용 계산:
일당 각 요청 크기 = 4,320,000자[300자 * 10개 문서 * 1,440분]
요청당 유닛 수 = 43,200유닛[432,000자 ÷ 유닛당 100자]
유닛당 요금 = 0.0005 USD
유닛의 총 추론 비용 = 21.60 USD[43,200유닛 x 0.0005 USD]
총 비용 = 25.10 USD[21.60 USD 추론 + 3 USD 모델 훈련 + 0.50 USD 모델 저장]
동기식 분류의 총 요금 계산:
먼저 필요한 처리량을 계산해보겠습니다. 매 분당 각각 300자 길이의 문서 10개를 분류합니다. 따라서 계산 결과는 다음과 같습니다.
초당 50자[300자 x 10개 문서 ÷ 60초]
따라서 초당 100자의 처리량을 제공하는 추론 유닛(IU) 1개를 사용하여 엔드포인트를 프로비저닝해야 합니다.
IU 1개의 요금 = 초당 0.0005 USD
추론 호출 횟수에 관계없이 실시간 분류 엔드포인트를 활성 상태로 유지하는 시간에 따라 비용이 발생합니다.
하루에 12시간 동안 실시간 분류 엔드포인트를 실행하는 경우 계산 결과는 다음과 같습니다.
총 추론 비용 = 21.60 USD[0.0005 USD x 3,600초 x 12시간]
총 비용 = 25.10 USD[21.60 USD 추론 + 3 USD 모델 훈련 + 0.50 USD 모델 저장]
프로비저닝된 처리량과 엔드포인트가 활성 상태로 유지되는 시간에 대해 요금이 발생합니다. 더 큰 처리량을 프로비저닝해야 했다면 요금은 다음과 같습니다.
IU 2개의 요금 = 초당 0.001 USD[0.0005 USD x 2]
IU 3개의 요금 = 초당 0.0015 USD[0.0005 USD x 3]
예제 4 - 사용자 지정 엔터티 API를 사용하여 고객 의견 분석
총 요금 계산:
각 요청의 크기 = 5,500,000자
요청당 단위 수 = 55,000단위[5,500,000자 ÷ 단위당 100자]
유닛당 요금 = 0.0005 USD
단위의 총 비용 = 27.5 USD[55,000단위 x 0.0005 USD]
총 모델 훈련 시간 = 1.5시간
시간당 요금 = 3 USD
총 모델 훈련 비용 = 4.5 USD[1.5시간 x 3 USD]
모델 관리 개월 수 = 1개월
월별 요금 = 0.50 USD
총 모델 관리 비용 = 0.50 USD[1개월 x 0.50 USD]
총 비용 = 37 USD[27.5 USD + 4.5 USD + 0.50 USD]
예제 5 - 이벤트 탐지를 사용하여 이벤트 및 연결된 정보 추출
총 요금 계산:
처리된 문자 수 = 문자 1,500,000개[기사 3,000개 x 문자 500개]
처리된 유닛 수 = 유닛 45,000개[1,500,000 x 이벤트 유형 3개 ÷ 유닛당 문자 수 100개]
유닛당 요금 = 0.003 USD
총 유닛 비용 = 135 USD[유닛 45,000개 x 0.003 USD]
예제 6 - PII 포함 API를 사용하여 PII에서 문서 식별
총 요금 계산:
각 요청의 크기 = 문자 550개
요청당 유닛 수 = 6
총 유닛: 60,000[요청 10,000개 x 요청당 유닛 수 6개]
유닛당 요금 = 0.000002 USD
총 비용 = 0.12 USD[유닛 60,000개 x 0.000002 USD]
예제 7 - PII 탐지 API를 사용하여 문서에서 PII 교정
총 요금 계산:
각 요청의 크기 = 문자 550개
요청당 유닛 수 = 6
총 유닛: 60,000[요청 10,000개 x 요청당 유닛 수 6개]
유닛당 요금 = 0.0001 USD
총 비용 = 6 USD[유닛 60,000개 x 0.0001 USD]
예제 8 – 사용자 지정 엔터티 API를 사용하여 모기지 신청서 엔터티 추출
비동기식 분류의 추론 비용 계산:
일당 각 요청 크기 = 2,500,000자[100개 신청서/일 * 10개 문서 * 2,500자]
요청당 유닛 수 = 25,000유닛[2,500,000자 ÷ 유닛당 100자]
유닛당 요금 = 0.0005 USD
유닛의 총 추론 비용 = 12.50 USD[25,000유닛 x 0.0005 USD]
Amazon Textract의 문서 텍스트 감지 API 비용= 1.50 USD[100개 신청서/일 * 10개 문서 * 페이지당 0.0015 USD의 가격, 최대 100만 페이지]
총 비용 = 17.50 USD[12.50 USD 추론 + 1.50 USD Textract + 3 USD 모델 훈련 + 0.50 USD 모델 저장]
예제 9 - 직원 설문 조사 응답 분석
총 요금 계산:
각 요청의 크기 = 350자
요청당 단위 수 = 4
총 단위: 100,000(요청 수) x 4(요청당 단위) = 400,000
단위당 요금 = 0.0001 USD(0~1천만 개 단위)
총 비용 = [단위 수] x [단위당 비용] = 40만 x 0.0001 USD = 40.00 USD
예제 10 - 웹 사이트 온라인 댓글의 유해성 검출
총 요금 계산:
각 요청의 크기 = 100자
요청당 단위 수 = 총 1개
단위 = 1억 IU[댓글 1억 개 x 요청당 단위 1개]
단위당 가격 = 0.0001 USD[0~1,000만 IU] + 0.00005 USD [1,000만~5,000만 IU] + 0.000025 USD [5,000만~1억 IU]
총 비용 = [단위 수] x [단위당 비용]
= [1,000만 X 0.001 USD] + [4,000 만 X 0.00005 USD] + [5,000만 X 0.000025 USD]
= 1,000 USD + 2,000 USD + 1,250 USD
= 4,250 USD
예제 11 - 생성형 AI 애플리케이션에서 안전하지 않은 프롬프트 감지
총 요금 계산:
각 요청의 크기 = 500자
요청당 단위 수 = 5
총 단위 = 5,000만 IU[댓글 1,000만 개 x 요청당 단위 5개]
단위당 가격 = 0.0001 USD[0~1,000만 IU] + 0.00005 USD [1,000만~5,000만 IU] + 0.000025 USD [5,000만~1억 IU]
총 비용 = [단위 수] x [단위당 비용]
= [1,000만 X 0.001 USD] + [4,000만 X 0.00005 USD]
= 1,000 USD + 2,000 USD
= 3,000 USD
Amazon Comprehend 기능에 대해 자세히 알아보기