Amazon Bedrock 요금

요금 개요

Amazon Bedrock은 완전관리형 서비스입니다. 단일 API를 통해 다양한 고성능 파운데이션 모델(FM) 중에서 선택할 수 있고 생성형 AI 애플리케이션을 구축하는 데 필요한 다양한 기능 세트를 제공하므로 보안, 개인 정보 보호, 책임 있는 AI를 준수하면서 간편하게 개발할 수 있습니다.

Amazon Bedrock을 사용하면 모델 추론 및 사용자 지정에 대한 비용이 청구됩니다. 추론용으로 선택할 수 있는 요금제에는 다음 두 가지가 있습니다. 1/ 온디맨드 및 배치: 이 모드를 사용하면 기간을 기준으로 약정하지 않고도 FM을 사용한 만큼만 지불하는 방식으로 사용할 수 있습니다. 2/ 프로비저닝된 처리량: 이 모드를 사용하면 기간 기준 약정의 대가로 애플리케이션의 성능 요구 사항을 충족하기에 충분한 처리량을 프로비저닝할 수 있습니다.

요금 모델

온디맨드

온디맨드 모드에서는 기간 약정 없이 사용한 만큼만 비용을 지불하면 됩니다. 텍스트 생성 모델의 경우 처리된 모든 입력 토큰과 생성된 모든 출력 토큰에 대해 요금이 부과됩니다. 임베딩 모델의 경우 처리된 모든 입력 토큰에 대해 요금이 부과됩니다. 토큰은 몇 개의 문자로 구성되며 모델이 사용자 입력과 프롬프트를 이해하기 위해 학습하는 기본 텍스트 단위를 나타냅니다. 이미지 생성 모델의 경우 생성된 모든 이미지에 대해 요금이 부과됩니다.

배치

배치 모드에서는 프롬프트 세트를 단일 입력 파일로 제공하고 응답을 단일 출력 파일로 수신하여 대규모 예측을 동시에 수행할 수 있습니다. 응답은 처리된 후 Amazon S3 버킷에 저장되므로 나중에 액세스할 수 있습니다. 배치 모드 요금은 온디맨드 모드 요금과 동일합니다.

프로비저닝된 처리량

프로비저닝된 처리량 모드에서는 특정 기본 모델이나 사용자 지정 모델의 모델 단위를 구매할 수 있습니다. 프로비저닝된 처리량 모드는 주로 보장된 처리량이 필요한 대규모의 일관된 추론 워크로드를 위해 설계되었습니다. 사용자 지정 모델은 프로비저닝된 처리량을 사용해야만 액세스할 수 있습니다. 모델 단위는 분당 처리되는 입력 또는 출력 토큰의 최대 수로 측정되는 특정 처리량을 제공합니다. 프로비저닝된 처리량 요금제에서는 시간 단위로 요금이 청구되므로 1개월 또는 6개월 약정 기간 중에서 유연하게 선택할 수 있습니다.

모델 사용자 지정

Amazon Bedrock을 사용하면 데이터로 FM을 사용자 지정하여 특정 작업 및 비즈니스 상황에 맞는 맞춤형 응답을 제공할 수 있습니다. 레이블이 지정된 데이터로 모델을 미세 조정하거나 레이블이 지정되지 않은 데이터로 지속적인 사전 학습을 사용하여 모델을 미세 조정할 수 있습니다. 텍스트 생성 모델을 사용자 지정하는 경우 모델에서 처리한 총 토큰 수(학습 데이터 코퍼스의 토큰 수에 에포크 수를 곱한 값) 및 모델당 월별 모델 스토리지 요금이 부과됩니다. 에포크는 미세 조정 또는 지속적인 사전 학습 중에 훈련 데이터 세트를 한 번 완전히 통과하는 것을 말합니다. 사용자 지정 모델을 사용한 추론은 프로비저닝된 처리량 플랜에 따라 요금이 부과되며 프로비저닝된 처리량을 구매해야 합니다. 사용자 지정 모델에 대한 추론을 위해 약정 기간 없이 하나의 모델 단위를 사용할 수 있습니다. 사용자 지정 모델 추론에 사용한 첫 번째 모델 단위에 대해 요금이 부과됩니다. 한 모델 단위 이상으로 처리량을 늘리려면 1개월 또는 6개월 약정 기간을 구매해야 합니다.

추가 비용 없이 구축할 수 있는 강력한 도구

Amazon Bedrock용 에이전트 및 Amazon Bedrock용 지식 베이스를 사용하는 경우 이러한 기능에 사용하는 모델 및 벡터 데이터베이스에 대해서만 요금이 부과됩니다.

요금 분석

요금은 전달 방식, 공급자 및 모델에 따라 다릅니다. 자세한 요금에 대해 보려면 모델 공급자를 선택하세요.

AI21 Labs

온디맨드 및 배치 요금

AI21 Labs 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금

Jurassic-2 Mid

0.0125 USD

0.0125 USD

Jurassic-2 Ultra

0.0188 USD

0.0188 USD

현재 Amazon Bedrock의 AI21 Labs 모델에는 모델 사용자 지정(미세 조정) 및 프로비저닝된 처리량이 지원되지 않습니다.

Amazon

지역

Anthropic

온디맨드 및 배치 요금

리전: 미국 동부(버지니아 북부) 및 미국 서부(오레곤)

Anthropic 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금

Claude 인스턴트

0.00080 USD

0.00240 USD

Claude 2.0/2.1

0.00800 USD

0.02400 USD

Claude 3 Opus*

0.01500 USD

0.07500 USD

Claude 3 Sonnet

0.00300 USD

0.01500 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

*Claude 3 Opus는 현재 미국 서부(오레곤) 리전에서 사용할 수 있습니다.

리전: 아시아 태평양(시드니)

Anthropic 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금

Claude 3 Sonnet

0.00300 USD

0.01500 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

리전: 유럽(파리)

Anthropic 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금

Claude 3 Sonnet

0.00300 USD

0.01500 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

리전: 아시아 태평양(도쿄)

Anthropic 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금

Claude 인스턴트

0.00080 USD

0.00240 USD

Claude 2.0/2.1

0.00800 USD

0.02400 USD

리전: EU(프랑크푸르트)

Anthropic 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금

Claude 인스턴트

0.00080 USD

0.00240 USD

Claude 2.0/2.1

0.00800 USD

0.02400 USD

프로비저닝된 처리량 요금:

리전: 미국 동부(버지니아 북부) 및 미국 서부(오레곤)

Anthropic 모델 무약정 시 모델별 시간당
요금
1개월 약정 시 모델 단위당 시간당 요금 6개월 약정 시 모델 단위당 시간당 요금

Claude Instant

44.00 USD

39.60 USD

22.00 USD

Claude 2.0/2.1

70.00 USD

63.00 USD

35.00 USD

Anthropic 모델 무약정 시 모델별 시간당
요금
1개월 약정 시 모델 단위당 시간당 요금 6개월 약정 시 모델 단위당 시간당 요금

Claude Instant

44.00 USD

39.60 USD

22.00 USD

Claude 2.0/2.1

70.00 USD

63.00 USD

35.00 USD

리전: 아시아 태평양(도쿄)

Anthropic 모델 1개월 약정 시 모델 단위당 시간당 요금 6개월 약정 시 모델 단위당 시간당 요금

Claude 인스턴트

53.00 USD

29.00 USD

Claude 2.0/2.1

86.00 USD

48.00 USD

리전: 유럽(프랑크푸르트)

Anthropic 모델 1개월 약정 시 모델 단위당 시간당 요금 6개월 약정 시 모델 단위당 시간당 요금

Claude 인스턴트

49.00 USD

27.00 USD

Claude 2.0/2.1

79.00 USD

44.00 USD

모델 단위에 대한 자세한 내용은 AWS 계정 팀에 문의하세요. 

Cohere

온디맨드 및 배치 요금

Cohere 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금
Command 0.0015 USD 0.0020 USD
Command-Light 0.0003 USD 0.0006 USD
Embed - 영어 0.0001 USD 해당 사항 없음
Embed - 다국어 0.0001 USD 해당 사항 없음

사용자 지정(미세 조정) 요금

Cohere 모델 1,000개의 토큰을 훈련하기 위한 요금 각 사용자 지정 모델의 월별 저장 요금 사용자 지정 모델에서 시간당 모델 단위당 추론 요금(약정이 없는 프로비저닝 처리량 요금 포함)

Cohere Command

0.004 USD

1.95 USD

49.50 USD

Cohere Command-Light 0.001 USD

1.95 USD

8.56 USD

*훈련된 총 토큰 = 훈련 데이터 코퍼스의 토큰 수 x 에포크 수

프로비저닝된 처리량 요금:

Cohere 모델 무약정 시 모델별 시간당 
요금
1개월 약정 시 모델 단위당 시간당 요금

6개월 약정 시 모델 단위당 시간당 요금

Cohere Command

49.50 USD

39.60 USD

23.77 USD

Cohere Command-Light 8.56 USD

6.85 USD

4.11 USD
Embed - 영어 7.12 USD

6.76 USD

6.41 USD
Embed - 다국어 7.12 USD

6.76 USD

6.41 USD

모델 단위에 대한 자세한 내용은 AWS 계정 또는 영업팀에 문의하세요. 

Meta Llama 2

온디맨드 및 배치 요금 

메타 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금

Llama 2 Chat(13B)

0.00075 USD

0.00100 USD

Llama 2 Chat(70B)

0.00195 USD

0.00256 USD

모델 사용자 지정(미세 조정)을 위한 요금

메타 모델 1,000개의 토큰을 훈련하기 위한 요금 각 사용자 지정 모델을 저장하는 데 드는 요금*(월별) 사용자 지정 모델에서 시간당 모델 단위 1개당 추론 요금(약정이 없는 프로비저닝 처리량 요금 포함)

Llama 2 Pre-trained(13B)

0.00149 USD

1.95 USD

23.50 USD

Llama 2 Pre-trained(70B)

0.00799 USD

1.95 USD 23.50 USD

*사용자 지정 모델 스토리지 = 1.95 USD

프로비저닝된 처리량 요금:

메타 모델 1개월 약정 시 모델 단위당 시간당 요금 6개월 약정 시 모델 단위당 시간당 요금

Llama 2 Pre-trained 및 Chat(13B)

21.18 USD

13.08 USD

Llama 2 Pre-trained(70B)

21.18 USD

13.08 USD

*Llama 2 Pre-trained 모델은 사용자 지정 후 프로비저닝된 처리량으로만 사용할 수 있습니다.

모델 단위에 대한 자세한 내용은 AWS 계정 또는 영업팀에 문의하세요.

Mistral AI

온디맨드 요금 - 리전: 미국 동부(버지니아 북부), 미국 서부(오레곤)

Mistral AI 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금
Mistral 7B

0.00015 USD

0.0002 USD

Mixtral 8*7B

0.00045 USD

0.0007 USD
Mistral Large 0.008 USD 0.024 USD

온디맨드 요금 - 리전: 유럽(파리), 아시아 태평양(시드니)

Mistral AI 모델 입력 토큰 1,000개당 요금 출력 토큰 1,000개당 요금
Mistral 7B

0.0002 USD

0.00026 USD

Mixtral 8*7B

0.00059 USD

0.00091 USD
Mistral Large 0.0104 USD 0.0312 USD
지역

Stability AI

온디맨드 및 배치 요금

Stability AI에서 제공하는 이미지 모델은 단계 수 및 이미지 해상도에 따라 이미지당 요금이 책정됩니다.

Stability AI 모델 이미지 해상도 표준 품질로 생성된 이미지당 요금(<=50단계) 프리미엄 품질로 생성된 이미지당 요금(50단계 이상)

 

SDXL 0.8

512 x 512 또는 그 이하

이미지당 0.018 USD

이미지당 0.036 USD

512 x 512 이상

이미지당 0.036 USD

이미지당 0.072 USD

SDXL 1.0

최대 1024 x 1024

0.04 USD 0.08 USD

프로비저닝된 처리량 요금:

Stability AI 모델 1개월 약정 시 모델 단위당 시간당 요금* 6개월 약정 시 모델 단위당 시간당 요금*

SDXL 1.0

49.86 USD

46.18 USD

*기본 및 사용자 지정 모델에 대한 추론이 포함됩니다.

모델 단위에 대한 자세한 내용은 AWS 계정 또는 영업팀에 문의하세요.

현재 Amazon Bedrock의 안정성 AI 모델에는 모델 사용자 지정(미세 조정)이 지원되지 않습니다.

요금 예

  • 애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. AI21의 Jurrasic-2 Mid 모델에 입력 텍스트의 토큰 입력 1만 개를 토큰 출력 2천 개로 요약하는 요청을 수행합니다.

    총 발생 비용 = 토큰 1만 개/1,000 * 0.0125 USD + 토큰 2천 개/1,000 * 0.0125 USD = 0.15 USD

  • 온디맨드 요금

    애플리케이션 개발자가 Amazon Bedrock에 시간당 다음과 같은 API 직접 호출을 수행합니다. Amazon Titan Text – Lite 모델에 입력 텍스트의 토큰 입력 2천 개를 토큰 출력 1천개로 요약하는 요청을 수행합니다.

    시간당 총 발생 비용 = 토큰 2천 개/1,000 * 0.0003 USD + 토큰 1천 개/1,000 * 0.0004 USD = 0.001 USD

    애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Titan Image Generator 기본 모델에 표준 품질 크기의 1024 x 1024 이미지 1,000개를 생성하는 요청을 수행합니다.

    총 발생 비용 = 이미지 1,000개 * 이미지당 0.01 USD = 10 USD

    사용자 지정(미세 조정 및 지속적인 사전 훈련) 요금

    애플리케이션 개발자가 1,000개의 이미지-텍스트 쌍을 사용하여 Titan Image Generation 모델을 사용자 정의합니다. 훈련 후 개발자는 1시간 동안 사용자 지정 모델 프로비저닝 처리량을 사용하여 모델의 성능을 평가합니다. 미세 조정된 모델은 1개월 동안 저장됩니다. 평가 후 개발자는 프로비저닝된 처리량(1개월 약정)을 사용하여 사용자 지정 모델을 호스팅합니다.

    미세 조정에 소요되는 월별 비용은 다음과 같습니다. 미세 조정 훈련(0.005 USD * 500 * 64). 여기서 0.005 USD는 이미지당 요금, 500은 단계 수, 64는는 배치 크기 + 월별 사용자 지정 모델 스토리지(1.95 USD) + 사용자 지정 모델 추론 1시간(21 USD) = 160 USD + 1.95 USD+ 21 USD = 182.95 USD

    프로비저닝된 처리량 요금

    애플리케이션 개발자가 텍스트 요약 사용 사례에 대해 1개월 약정으로 Titan Text Express의 모델 유닛 2개를 구입합니다.

    월별 총 발생 비용 = 모델 유닛 2개 * 18.40 USD/시간 * 24시간* 31일 = 27,379.20 USD

    애플리케이션 개발자가 1개월 약정으로 기본 Titan Image Generator 모델의 모델 유닛 1개를 구입합니다.

    총 발생 비용 = 1 * 16.20 USD * 24시간* 31일 = 12,052.80 USD

  • 온디맨드 요금

    애플리케이션 개발자가 미국 서부(오레곤) 리전의 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Anthropic의 Claude 모델에 입력 텍스트의 토큰 입력 1만 1천 개를 토큰 출력 4천 개로 요약하는 요청을 수행합니다.

    총 발생 비용 = 토큰 1만 1천 개/1,000 * 0.008 USD + 토큰 4천 개/1,000 * 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD

    프로비저닝된 처리량 요금

    애플리케이션 개발자가 미국 서부(오레곤) 리전에서 Anthropic Claude Instant의 모델 유닛 1개를 구입합니다.

    월별 총 발생 비용 = 모델 유닛 1개 * 39.60 USD* 24시간* 31일 = 29,462.40 USD

  • 온디맨드 요금

    애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Cohere의 Command 모델에 입력 텍스트의 토큰 입력 6천 개를 토큰 출력 2천 개로 요약하는 요청을 수행합니다.

    총 발생 비용 = 토큰 6천 개/1,000 * 0.00150 USD+ 토큰 2천 개/1,000 * 0.0020 USD = 0.013 USD

    애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Cohere의 Command-Light 모델에 입력 텍스트의 토큰 입력 6천 개를 토큰 출력 2천 개로 요약하는 요청을 수행합니다.

    총 발생 비용 = 토큰 6천 개/1,000 * 0.0003 USD + 토큰 2천 개/1,000 * 0.0006 USD = 0.003 USD

    애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Cohere의 Embed English 또는 다국어 모델에 입력 토큰 1만 개에 대한 임베딩을 생성하는 요청을 수행합니다.

    총 발생 비용 = 토큰 1만 개/1,000 * 0.0001 USD = 0.001 USD

    사용자 지정(미세 조정) 요금

    애플리케이션 개발자가 1,000개의 데이터 토큰을 사용하여 Cohere Command 모델을 사용자 정의합니다. 훈련 후 1시간 동안 사용자 지정 모델 프로비저닝 처리량을 사용하여 모델의 성능을 평가합니다. 미세 조정된 모델은 1개월 동안 저장됩니다. 평가 후 개발자는 프로비저닝된 처리량(1개월 약정)을 사용하여 사용자 지정 모델을 호스팅합니다.

    미세 조정에 발생되는 월별 비용 = 미세 조정 훈련(0.004 USD * 1,000) +월별 사용자 지정 모델 스토리지(1.95 USD) + 1시간의 사용자 지정 모델 추론(49.50 USD) = 55.45 USD

    사용자 지정 모델의 프로비저닝된 처리량(1개월 약정)에 대해 발생한 월별 비용 = 39.60 USD

    프로비저닝된 처리량 요금

    애플리케이션 개발자가 텍스트 요약 사용 사례에 대해 1개월 약정으로 Cohere Command의 모델 유닛 1개를 구입합니다.

    월별 총 발생 비용 = 모델 유닛 1개 * 39.60 USD* 24시간* 31일 = 29,462.40 USD

  • 온디맨드 요금

    애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Meta의 Lama 2 Chat(13B) 모델에 입력 텍스트의 토큰 입력 2천 개를 토큰 출력 500개로 요약하는 요청을 수행합니다.

    총 발생 비용 = 토큰 2천 개/1,000 * 0.00075 USD + 토큰 500개/1,000 * 0.001 USD = 0.002 USD

    사용자 지정(미세 조정) 요금

    애플리케이션 개발자가 1,000개의 데이터 토큰을 사용하여 Lama 2 사전 훈련(70B) 모델을 사용자 정의합니다. 훈련 후 1시간 동안 사용자 지정 모델 프로비저닝 처리량을 사용하여 모델의 성능을 평가합니다. 미세 조정된 모델은 1개월 동안 저장됩니다. 평가 후 개발자는 프로비저닝된 처리량(1개월 약정)을 사용하여 사용자 지정 모델을 호스팅합니다.

    미세 조정에 발생되는 월별 비용 = 미세 조정 훈련(0.00799 USD * 1,000) +월별 사용자 지정 모델 스토리지(1.95 USD) + 1시간의 사용자 지정 모델 추론(23.50 USD) = 33.44 USD

    사용자 지정 모델의 프로비저닝된 처리량(1개월 약정)에 대해 발생한 월별 비용 = 21.18 USD

    프로비저닝된 처리량 요금

    애플리케이션 개발자가 텍스트 요약 사용 사례에 대해 1개월 약정으로 Meta Lama 2의 모델 유닛 1개를 구입합니다.

    월별 총 발생 비용 = 모델 유닛 1개 * 21.20 USD* 24시간* 31일 = 15,772.8 USD

  • 온디맨드 요금

    애플리케이션 개발자가 Amazon Bedrock에 시간당 다음과 같은 API 직접 호출을 수행합니다. Mistral 7B 모델에 입력 텍스트의 토큰 입력 2천 개를 토큰 출력 1천개로 요약하는 요청을 수행합니다.

    시간당 총 발생 비용 = 토큰 2천 개/1,000 * 0.00015 USD + 토큰 1천 개/1,000 * 0.0002 USD = 0.0005 USD

    애플리케이션 개발자가 Amazon Bedrock에 시간당 다음과 같은 API 직접 호출을 수행합니다. Mixtral 8x7B 모델에 입력 텍스트의 토큰 입력 2천 개를 토큰 출력 1천개로 요약하는 요청을 수행합니다.

    시간당 총 발생 비용 = 토큰 2,000개/1,000 * 0.00045 USD + 토큰 1,000개/1,000 * 0.0007 USD = 0.0016 USD

    애플리케이션 개발자가 Amazon Bedrock에 시간당 다음과 같은 API 직접 호출을 수행합니다. Mistral 대용량 모델에 입력 텍스트의 토큰 입력 2,000개를 토큰 출력 1,000개로 요약하는 요청을 수행합니다. 

    시간당 총 발생 비용 = 토큰 2,000개/1,000 * 0.008 USD + 토큰 1,000개/1000 * 0.024 USD = 0.04 USD

  • 온디맨드 요금

    애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. SDXL 모델에 단계 크기가 70인 512 x 512 이미지(프리미엄 품질)를 생성하는 요청을 수행합니다.

    총 발생 비용 = 이미지 1개 * 이미지당 0.036 USD = 0.036 USD

    애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. SDXL1.0 모델에 단계 크기가 70인 1024 x 1024 이미지(프리미엄 품질)를 생성하는 요청을 수행합니다.

    총 발생 비용 = 이미지 1개 * 이미지당 0.08 USD = 0.08 USD

    프로비저닝된 처리량 요금

    애플리케이션 개발자가 1개월 약정으로 SDXL1.0의 모델 유닛 1개를 구입합니다.

    총 발생 비용 = 1 * 49.86 USD * 24시간* 31일 = 37,095.84 USD