Amazon Bedrock 요금
-
모델 요금
-
Knowledge Bases
-
가드레일
-
모델 평가
-
데이터 자동화
-
지능형 프롬프트 라우팅
-
프롬프트 최적화
-
모델 요금
-
모델 요금
요금은 전달 방식, 공급자, 모델에 따라 다릅니다. 자세한 요금을 보려면 모델 공급자를 선택하세요.
Amazon Bedrock은 Standard, Flex, Priority, Reserved 티어 등, 다양한 티어를 지원합니다. 서비스 티어에 대해 자세히 알아보려면 클릭하세요.
Amazon Bedrock은 Anthropic, Meta, Mistral AI, Amazon 같은 주요 AI 제공업체가 제공하는 엄선된 배치 추론용 파운데이션 모델(FM)을 온디맨드 추론 요금 대비 50% 저렴한 가격으로 제공합니다. Batch에 대해 자세히 알아보려면 여기에서 를 클릭하세요. 여기에서 모델 목록 을 참조하세요.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
DeepSeek
-
Google
-
Luma AI
-
Meta
-
MiniMax AI
-
Mistral AI
-
Moonshot AI
-
NVIDIA
-
OpenAI
-
Qwen
-
Stability AI
-
TwelveLabs
-
Writer
-
Z AI
-
사용자 지정 모델 가져오기
-
AI21 Labs
-
AI21 Labs
온디맨드 요금
-
Amazon
-
-
Amazon Nova
-
Amazon Titan
-
기타 Amazon
-
Amazon Nova
-
Amazon Nova
모델 이해를 위한 요금
글로벌 교차 리전 추론
지리적 위치 교차 지역 추론 및 지역 내 추론
기본 제공 도구
크리에이티브 콘텐츠 생성 모델 요금
음성 이해 및 생성 모델 요금
음성-음성 파운데이션 모델에 대한 온디맨드 요금
참고: *텍스트 토큰 입력 및 출력 요금은 음성-텍스트 트랜스크립션, 작업 완료를 위한 도구 직접 호출 또는 지식 그라운딩, 세션에 대화 기록 추가 등과 같은 특정 사용 사례에 적용됩니다.
사용자 지정 Nova 모델의 온디맨드 추론 요금은 기본 Nova 추론과 같습니다.
임베딩 모델 요금
-
Amazon Titan
-
Amazon Titan
-
기타 Amazon
-
-
-
Anthropic
-
Anthropic
온디맨드 및 배치 요금
확장 액세스가 있는 모델
제공업체 모델 이름 리전 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 입력 토큰 1백만 개당 가격(배치) 출력 토큰 1백만 개당 가격(배치) 입력 토큰 1백만 개당 가격(캐시 쓰기) 입력 토큰 1백만 개당 가격(캐시 읽기) Anthropic Claude 3.5 Sonnet(퍼블릭 확장 액세스, 발효일: 2025년 12월 1일) 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건), 유럽(프랑크푸르트), 유럽(아일랜드), 유럽(취리히), 유럽(파리) 6.00 USD 30.00 USD 3.00 USD 15.00 USD 해당 사항 없음 해당 사항 없음 Anthropic Claude 3.5 Sonnet v2(퍼블릭 확장 액세스, 발효일: 2025년 12월 1일) 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건) 6.00 USD 30.00 USD 3.00 USD 15.00 USD 7.50 USD 0.60 USD Reserved 티어 요금
지연 시간 최적화 추론
프로비저닝된 처리량 요금
프로비저닝된 처리량 요금에 대해서는 어카운트 팀에 문의하시기 바랍니다.
-
Cohere
-
Cohere
온디맨드 요금
Cohere 모델 1,000개의 쿼리당 요금** Rerank 3.5 2.00 USD ** 쿼리에 최대 100개의 문서 청크를 포함할 수 있는 쿼리 수에 대해 요금이 부과됩니다. 쿼리에 100개가 넘는 문서 청크가 포함된 경우 여러 쿼리로 계산됩니다. 예를 들어 350개의 문서가 포함된 요청은 4개의 쿼리로 처리됩니다. 각 문서는 최대 500개의 토큰(쿼리 및 문서의 총 토큰 포함)만 포함할 수 있으며, 토큰 길이가 512개 토큰보다 크면 여러 문서로 분류된다는 점에 유의하세요. 사용자 지정(미세 조정) 요금
*훈련된 총 토큰 수 = 훈련 데이터 코퍼스의 토큰 수 x 에포크 수
프로비저닝된 처리량 요금
Cohere 모델 무약정 시 모델별 시간당
요금1개월 약정 시 모델 단위당 시간당 요금 6개월 약정 시 모델 단위당 시간당 요금
Cohere Command
49.50 USD 39.60 USD
23.77 USD
Cohere Command - Light 8.56 USD 6.85 USD
4.11 USD Embed 3 영어 7.12 USD 6.76 USD
6.41 USD Embed 3 다국어 7.12 USD 6.76 USD
6.41 USD 모델 단위에 대한 자세한 내용은 AWS 계정 또는 영업팀에 문의하세요.
-
DeepSeek
-
DeepSeek
온디맨드 요금
-
Standard
-
Priority
-
Flex
-
Standard
-
리전: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
DeepSeek 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 DeepSeek v3.2 0.62 USD 1.85 USD 리전: 아시아 태평양(뭄바이), 남아메리카(상파울루), 아시아 태평양(자카르타), 아시아 태평양(도쿄), 유럽(스톡홀름)
DeepSeek 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 DeepSeek v3.2 0.74 USD 2.22 USD 리전: 아시아 태평양(시드니)
DeepSeek 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 DeepSeek v3.1 0.5974 USD 1.7304 USD DeepSeek v3.2 0.6386 USD 1.9055 USD -
Priority
-
리전: 아시아 태평양(시드니)
DeepSeek 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 DeepSeek v3.1 1.0455 USD 3.0282 USD -
Flex
-
리전: 아시아 태평양(시드니)
DeepSeek 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 DeepSeek v3.1 0.2987 USD 0.8652 USD
-
-
Google
-
Google
온디맨드 요금
지역: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
Google 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Gemma 3 4B 0.04 USD 0.08 USD Gemma 3 12B 0.09 USD 0.29 USD Gemma 3 27B 0.23 USD 0.38 USD 리전: 아시아 태평양(뭄바이), 유럽(아일랜드), 유럽(밀라노)
Google 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Gemma 3 4B 0.05 USD 0.09 USD Gemma 3 12B 0.11 USD 0.34 USD Gemma 3 27B 0.27 USD 0.45 USD 리전: 남미(상파울루) 및 아시아 태평양(도쿄)
Google 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Gemma 3 4B 0.05 USD 0.10 USD Gemma 3 12B 0.11 USD 0.35 USD Gemma 3 27B 0.28 USD 0.46 USD 리전: 유럽(런던)
Google 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Gemma 3 4B 0.06 USD 0.12 USD Gemma 3 12B 0.14 USD 0.45 USD Gemma 3 27B 0.36 USD 0.59 USD 리전: 아시아 태평양(시드니)
Google 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Gemma 3 4B 0.0412 USD 0.0824 USD Gemma 3 12B 0.0927 USD 0.2987 USD Gemma 3 27B 0.2369 USD 0.3914 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* 플렉스 등급 요금은 표준 등급 요금 대비 50% 할인된 가격입니다. -
Luma AI
-
온디맨드 요금
-
Meta
-
Meta
Llama 4
온디맨드 및 배치 요금
Llama 3.3
온디맨드 및 배치 요금
Llama 3.2
온디맨드 및 배치 요금
모델 사용자 지정(미세 조정) 요금
프로비저닝된 처리량 요금
Llama 3.1
온디맨드 및 배치 요금
모델 사용자 지정(미세 조정)을 위한 요금
프로비저닝된 처리량 요금
Llama 3
온디맨드 요금
Llama 2
온디맨드 요금
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
Meta 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Llama 2 Chat(13B)
0.75 USD
1.00 USD
Llama 2 Chat(70B) 1.95 USD
2.56 USD 모델 사용자 지정(미세 조정) 요금
Meta 모델 토큰 1백만 개 훈련 가격 각 사용자 지정 모델을 저장하는 데 드는 요금*(월별) 사용자 지정 모델에서 시간당 모델 단위 1개당 추론 요금(약정이 없는 프로비저닝 처리량 요금 포함) Llama 2 Pretrained(13B)
1.49 USD
1.95 USD
23.50 USD
Llama 2 Pretrained(70B) 7.99 USD
1.95 USD 23.50 USD *사용자 지정 모델 스토리지 = 1.95 USD
프로비저닝된 처리량 요금
메타 모델 1개월 약정 시 모델 단위당 시간당 요금 6개월 약정 시 모델 단위당 시간당 요금 Llama 2 Pretrained 및 Chat(13B)
21.18 USD
13.08 USD
Llama 2 Pretrained(70B) 21.18 USD
13.08 USD *Llama 2 Pre-trained 모델은 사용자 지정 후 프로비저닝된 처리량으로만 사용할 수 있습니다.
모델 단위에 대한 자세한 내용은 AWS 계정 또는 영업팀에 문의하세요.
-
MiniMax AI
-
MiniMax AI
온디맨드 요금
지역: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
Minimax 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Minimax M2 0.30 USD 1.20 USD Minimax M2.1 0.30 USD 1.20 USD 리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
Minimax 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Minimax M2.5 0.30 USD 1.20 USD 리전: 아시아 태평양(뭄바이), 유럽(아일랜드), 유럽(밀라노)
Minimax 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Minimax M2 0.35 USD 1.41 USD Minimax M2.1 0.36 USD 1.44 USD 리전: 남미(상파울루) 및 아시아 태평양(도쿄)
Minimax 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Minimax M2 0.36 USD 1.45 USD Minimax M2.1 0.36 USD 1.44 USD 리전: 유럽(런던)
Minimax 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Minimax M2 0.47 USD 1.86 USD Minimax M2.1 0.47 USD 1.86 USD 리전: 유럽(프랑크푸르트), 유럽(스톡홀름), 아시아 태평양(자카르타)
Minimax 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Minimax M2.1 0.36 USD 1.44 USD 리전: 아시아 태평양(시드니)
Minimax 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Minimax M2 0.3090 USD 1.2360 USD Minimax M2.1 0.3090 USD 1.2360 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* 플렉스 등급 요금은 표준 등급 요금 대비 50% 할인된 가격입니다. -
Mistral AI
-
Mistral AI
온디맨드 요금
지역: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
Mistral 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Devstral 2 135B 0.40 USD 2.00 USD Magistral Small 1.2 0.50 USD 1.50 USD Voxtral Mini 1.0 0.04 USD 0.04 USD Voxtral Small 1.0 0.10 USD 0.30 USD Ministral 3B 3.0 0.10 USD 0.10 USD Ministral 8B 3.0 0.15 USD 0.15 USD Ministral 14B 3.0 0.20 USD 0.20 USD Mistral Large 3 0.50 USD 1.50 USD 리전: 아시아 태평양(뭄바이)
Mistral 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Devstral 2 135B 0.48 USD 2.40 USD Magistral Small 1.2 0.59 USD 1.76 USD Voxtral Mini 1.0 0.05 USD 0.05 USD Voxtral Small 1.0 0.12 USD 0.35 USD Ministral 3B 3.0 0.12 USD 0.12 USD Ministral 8B 3.0 0.18 USD 0.18 USD Ministral 14B 3.0 0.24 USD 0.24 USD Mistral Large 3 0.59 USD 1.76 USD 리전: 남미(상파울루) 및 아시아 태평양(도쿄)
Mistral 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Devstral 2 135B 0.48 USD 2.40 USD Magistral Small 1.2 0.61 USD 1.82 USD Voxtral Mini 1.0 0.05 USD 0.05 USD Voxtral Small 1.0 0.12 USD 0.36 USD Ministral 3B 3.0 0.12 USD 0.12 USD Ministral 8B 3.0 0.18 USD 0.18 USD Ministral 14B 3.0 0.24 USD 0.24 USD Mistral Large 3 0.61 USD 1.82 USD 리전: 유럽(아일랜드) 및 유럽(밀라노)
Mistral 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Devstral 2 135B 0.48 USD 2.40 USD Magistral Small 1.2 0.59 USD 1.76 USD Voxtral Mini 1.0 0.05 USD 0.05 USD Voxtral Small 1.0 0.12 USD 0.35 USD Ministral 3B 3.0 0.12 USD 0.12 USD Ministral 8B 3.0 0.18 USD 0.18 USD Ministral 14B 3.0 0.24 USD 0.24 USD 리전: 유럽(런던)
Mistral 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Devstral 2 135B 0.62 USD 3.10 USD Magistral Small 1.2 0.78 USD 2.33 USD Voxtral Mini 1.0 0.06 USD 0.06 USD Voxtral Small 1.0 0.16 USD 0.47 USD Ministral 3B 3.0 0.16 USD 0.16 USD Ministral 8B 3.0 0.23 USD 0.23 USD Ministral 14B 3.0 0.31 USD 0.31 USD 리전: 아시아 태평양(시드니)
Mistral 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Devstral 2 135B 0.41 USD 2.06 USD Magistral Small 1.2 0.5150 USD 1.5450 USD Voxtral Mini 1.0 0.0412 USD 0.0412 USD Voxtral Small 1.0 0.1030 USD 0.3090 USD Ministral 3B 3.0 0.1030 USD 0.1030 USD Ministral 8B 3.0 0.1545 USD 0.1545 USD Ministral 14B 3.0 0.2060 USD 0.2060 USD Mistral Large 3 0.5150 USD 1.5450 USD 리전: 아시아 태평양(자카르타), 유럽(프랑크푸르트), 유럽(스톡홀름)
Mistral 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Devstral 2 135B 0.48 USD 2.40 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* Flex 티어 요금은 Standard 티어 요금 대비 50% 할인된 가격입니다. -
Moonshot AI
-
Moonshot AI
온디맨드 요금
지역: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
Kimi 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Kimi K2 Thinking 0.60 USD 2.50 USD Kimi K2.5 0.60 USD 3.00 USD 리전: 아시아 태평양(뭄바이)
Kimi 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Kimi K2 Thinking 0.71 USD 2.94 USD Kimi K2.5 0.72 USD 3.60 USD 리전: 남미(상파울루) 및 아시아 태평양(도쿄)
Kimi 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Kimi K2 Thinking 0.73 USD 3.03 USD Kimi K2.5 0.72 USD 3.60 USD 리전: 유럽(스톡홀름), 아시아 태평양(자카르타)
Kimi 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Kimi K2.5 0.72 USD 3.60 USD 리전: 아시아 태평양(시드니)
Kimi 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Kimi K2 Thinking 0.6180 USD 2.5750 USD Kimi K2.5 0.6180 USD 3.0900 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* 플렉스 등급 요금은 표준 등급 요금 대비 50% 할인된 가격입니다. -
NVIDIA
-
NVIDIA
온디맨드 요금
지역: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
NVIDIA 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 NVIDIA Nemotron Nano 2 0.06 USD 0.23 USD NVIDIA Nemotron Nano 2 VL 0.20 USD 0.60 USD NVIDIA Nemotron 3 Nano 30B A3B 0.06 USD 0.24 USD 리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
NVIDIA 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 NVIDIA Nemotron 3 Super 120B A12B 0.15 USD 0.65 USD 리전: 아시아 태평양(뭄바이), 유럽(아일랜드), 유럽(밀라노)
NIVIDIA 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 NVIDIA Nemotron Nano 2 0.07 USD 0.27 USD NVIDIA Nemotron Nano 2 VL 0.24 USD 0.71 USD NVIDIA Nemotron 3 Nano 30B A3B 0.07 USD 0.28 USD 리전: 남미(상파울루) 및 아시아 태평양(도쿄)
NVIDIA 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 NVIDIA Nemotron Nano 2 0.07 USD 0.28 USD NVIDIA Nemotron Nano 2 VL 0.24 USD 0.73 USD NVIDIA Nemotron 3 Nano 30B A3B 0.07 USD 0.29 USD 리전: 유럽(런던)
NIVIDIA 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 NVIDIA Nemotron Nano 2 0.09 USD 0.36 USD NVIDIA Nemotron Nano 2 VL 0.31 USD 0.93 USD NVIDIA Nemotron 3 Nano 30B A3B 0.09 USD 0.37 USD 리전: 아시아 태평양(시드니)
NVIDIA 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 NVIDIA Nemotron Nano 2 0.0618 USD 0.2369 USD NVIDIA Nemotron Nano 2 VL 0.2060 USD 0.6180 USD NVIDIA Nemotron 3 Nano 30B A3B 0.0618 USD 0.2472 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* Flex 티어 및 배치 요금은 Standard 티어 요금 대비 50% 할인된 가격입니다. -
OpenAI
-
OpenAI
-
gpt-oss-20b, 120b
-
gpt-oss-safeguard 20b, 120b
-
gpt-oss-20b, 120b
-
-
Standard
-
Priority
-
Flex
-
배치
-
모델 사용자 지정
-
Standard
-
리전: 아시아 태평양(시드니)
OpenAI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 gpt-oss-20b 0.0721 USD 0.3090 USD gpt-oss-120b 0.1545 USD 0.6180 USD -
Priority
-
리전: 아시아 태평양(시드니)
OpenAI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 gpt-oss-20b 0.1262 USD 0.5408 USD gpt-oss-120b 0.2704 USD 1.0815 USD -
Flex
-
리전: 아시아 태평양(시드니)
OpenAI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 gpt-oss-20b 0.0361 USD 0.1545 USD gpt-oss-120b 0.0773 USD 0.3090 USD -
배치
-
리전: 아시아 태평양(시드니)
OpenAI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 gpt-oss-20b 0.0361 USD 0.1545 USD gpt-oss-120b 0.0773 USD 0.3090 USD -
모델 사용자 지정
-
모델 사용자 지정
강화 미세 조정 요금
Amazon Bedrock의 강화 미세 조정 기능을 사용하면 심층 기계 학습을 위한 전문적인 지식이나 레이블이 지정된 대량 데이터 없이도 모델 정확도를 개선할 수 있습니다. Amazon Bedrock은 강화 미세 조정 워크플로를 자동화합니다. 샘플 프롬프트를 가져와 모델 응답을 생성하고 보상 함수를 사용하여 점수를 매길 수 있습니다. 그런 다음 이러한 프롬프트, 응답 및 점수를 기반으로 반복적인 RFT 워크플로를 통해 모델을 훈련합니다.
전체 훈련 워크플로에는 시간당 요금이 청구됩니다. 훈련이 완료되면 고객은 미세 조정된 결과 모델을 온디맨드 추론에 즉시 사용할 수 있습니다. 온디맨드 추론 옵션에는 추론 중에 처리된 토큰 수를 기준으로 요금이 부과되는 토큰 기반 가격 책정 모델이 포함됩니다.
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
OpenAI 모델 훈련 시간당 가격 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 훈련된 각 모델의 월별 저장 가격 gpt-oss-20b 80.00 USD 0.09 USD 0.39 USD 1.95 USD
-
-
gpt-oss-safeguard 20b, 120b
-
온디맨드 요금
지역: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
OpenAI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GPT OSS Safeguard 20B 0.07 USD 0.20 USD GPT OSS Safeguard 120B 0.15 USD 0.60 USD 리전: 아시아 태평양(뭄바이), 남아메리카(상파울루), 아시아 태평양(도쿄)
OpenAI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GPT OSS Safeguard 20B 0.08 USD 0.24 USD GPT OSS Safeguard 120B 0.18 USD 0.71 USD 리전: 유럽(아일랜드) 및 유럽(밀라노)
OpenAI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GPT OSS Safeguard 20B 0.08 USD 0.23 USD GPT OSS Safeguard 120B 0.18 USD 0.70 USD 리전: 유럽(런던)
OpenAI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GPT OSS Safeguard 20B 0.11 USD 0.31 USD GPT OSS Safeguard 120B 0.23 USD 0.93 USD 리전: 아시아 태평양(시드니)
OpenAI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GPT OSS Safeguard 20B 0.0721 USD 0.2060 USD GPT OSS Safeguard 120B 0.1545 USD 0.6180 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* Flex 티어 및 배치 요금은 Standard 티어 요금 대비 50% 할인된 가격입니다.
-
-
Qwen
-
Qwen
-
Qwen3 Coder, 32B, 235B
-
Qwen 3 Next, VL, Coder Next
-
Qwen3 Coder, 32B, 235B
-
-
Standard
-
Priority
-
Flex
-
배치
-
모델 사용자 지정
-
Standard
-
리전: 아시아 태평양(시드니)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Coder 30B A3B 0.1545 USD 0.6180 USD Qwen3 32B 0.1545 USD 0.6180 USD Qwen3 235B A22B 2507 0.2266 USD 0.9064 USD -
Priority
-
리전: 아시아 태평양(시드니)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Coder 30B A3B 0.2704 USD 1.0815 USD Qwen3 32B 0.2704 USD 1.0815 USD Qwen3 235B A22B 2507 0.3966 USD 1.5862 USD -
Flex
-
리전: 아시아 태평양(시드니)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Coder 30B A3B 0.0773 USD 0.3090 USD Qwen3 32B 0.0773 USD 0.3090 USD Qwen3 235B A22B 2507 0.1133 USD 0.4532 USD -
배치
-
리전: 아시아 태평양(시드니)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Coder 30B A3B 0.0773 USD 0.3090 USD Qwen3 32B 0.0773 USD 0.3090 USD Qwen3 235B A22B 2507 0.1133 USD 0.4532 USD -
모델 사용자 지정
-
모델 사용자 지정
강화 미세 조정 요금
Amazon Bedrock의 강화 미세 조정 기능을 사용하면 심층 기계 학습을 위한 전문적인 지식이나 레이블이 지정된 대량 데이터 없이도 모델 정확도를 개선할 수 있습니다. Amazon Bedrock은 강화 미세 조정 워크플로를 자동화합니다. 샘플 프롬프트를 가져와 모델 응답을 생성하고 보상 함수를 사용하여 점수를 매길 수 있습니다. 그런 다음 이러한 프롬프트, 응답 및 점수를 기반으로 반복적인 RFT 워크플로를 통해 모델을 훈련합니다.
전체 훈련 워크플로에는 시간당 요금이 청구됩니다. 훈련이 완료되면 고객은 미세 조정된 결과 모델을 온디맨드 추론에 즉시 사용할 수 있습니다. 온디맨드 추론 옵션에는 추론 중에 처리된 토큰 수를 기준으로 요금이 부과되는 토큰 기반 가격 책정 모델이 포함됩니다.
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
Qwen 모델 훈련 시간당 가격 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 훈련된 각 모델의 월별 저장 가격 Qwen3 32B 80.00 USD 0.20 USD 0.78 USD 1.95 USD
-
-
Qwen 3 Next, VL, Coder Next
-
온디맨드 요금
지역: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Next 80B A3B 0.15 USD 1.20 USD Qwen3 VL 235B A22B 0.53 USD 2.66 USD Qwen3 Coder Next 0.50 USD 1.20 USD 리전: 아시아 태평양(뭄바이), 유럽(아일랜드), 유럽(밀라노)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Next 80B A3B 0.18 USD 1.41 USD Qwen3 VL 235B A22B 0.62 USD 3.13 USD Qwen3 Coder Next 0.60 USD 1.44 USD 리전: 남미(상파울루) 및 아시아 태평양(도쿄)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Next 80B A3B 0.18 USD 1.45 USD Qwen3 VL 235B A22B 0.64 USD 3.22 USD Qwen3 Coder Next 0.60 USD 1.44 USD 리전: 유럽(런던)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Next 80B A3B 0.23 USD 1.86 USD Qwen3 VL 235B A22B 0.82 USD 4.12 USD Qwen3 Coder Next 0.78 USD 1.86 USD 리전: 유럽(프랑크푸르트) 및 아시아 태평양(자카르타)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Coder Next 0.60 USD 1.44 USD 리전: 아시아 태평양(시드니)
Qwen 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Qwen3 Next 80B A3B 0.1545 USD 1.2360 USD Qwen3 VL 235B A22B 0.5459 USD 2.7398 USD Qwen3 Coder Next 0.5150 USD 1.2360 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* Flex 티어 및 배치 요금은 Standard 티어 요금 대비 50% 할인된 가격입니다.
-
-
Stability AI
-
Stability AI
온디맨드 요금
Stability AI에서 제공하는 이전 세대 이미지 모델은 단계 수 및 이미지 해상도에 따라 이미지당 요금이 책정됩니다.
리전: 오리건, 버지니아 북부, 오하이오
Stability AI Image 서비스 각 모델의 생성당 요금 Stable Image Remove Background 0.07 USD Stable Image Erase Object 0.07 USD Stable Image Control Structure 0.07 USD Stable Image Control Sketch 0.07 USD Stable Image Style Guide 0.07 USD Stable Image Search and Replace 0.07 USD Stable Image Inpaint 0.07 USD Stable Image Search and Recolor 0.07 USD Stable Image Style Transfer 0.08 USD Stable Image 보수적 업스케일 0.40 USD Stable Image 창의적 업스케일 0.60 USD Stable Image 고속 업스케일 0.03 USD Stable Image Outpaint 0.06 USD -
TwelveLabs
-
TwelveLabs
온디맨드 요금
-
글로벌 교차 리전 추론
-
지리적 위치 및 리전 내 교차 리전 추론
-
글로벌 교차 리전 추론
-
-
지리적 위치 및 리전 내 교차 리전 추론
-
-
-
Writer
-
Writer
온디맨드 요금
Writer 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 Palmyra X4 2.50 USD 10.00 USD Palmyra X5 0.60 USD 6.00 USD -
Z AI
-
Z AI
-
GLM 5
-
GLM 4.7
-
GLM 4.7 Flash
-
GLM 5
-
온디맨드 요금
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
Z AI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GLM 5 1.00 USD 3.20 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* Flex 티어 및 배치 요금은 Standard 티어 요금 대비 50% 할인된 가격입니다. -
GLM 4.7
-
온디맨드 요금
리전: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
Z AI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GLM 4.7 0.60 USD 2.20 USD 리전: 아시아 태평양(자카르타), 아시아 태평양(뭄바이), 아시아 태평양(도쿄), 남아메리카(상파울루) 및 유럽(스톡홀름)
Z AI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GLM 4.7 0.72 USD 2.64 USD 리전: 아시아 태평양(시드니)
Z AI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GLM 4.7 0.6180 USD 2.2660 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* Flex 티어 및 배치 요금은 Standard 티어 요금 대비 50% 할인된 가격입니다. -
GLM 4.7 Flash
-
온디맨드 요금
리전: 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건)
Z AI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GLM 4.7 Flash 0.07 USD 0.40 USD 리전: 아시아 태평양(자카르타), 아시아 태평양(뭄바이), 아시아 태평양(도쿄), 유럽(프랑크푸르트), 유럽(아일랜드), 유럽(밀라노), 유럽(스톡홀름) 및 남아메리카(상파울루)
Z AI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GLM 4.7 Flash 0.08 USD 0.48 USD 리전: 유럽(런던)
Z AI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GLM 4.7 Flash 0.11 USD 0.62 USD 리전: 아시아 태평양(시드니)
Z AI 모델 입력 토큰 1백만 개당 가격 출력 토큰 1백만 개당 가격 GLM 4.7 Flash 0.0721 USD 0.4120 USD * Priority 티어 요금은 Standard 티어 요금 대비 75% 더 높습니다.
* Flex 티어 및 배치 요금은 Standard 티어 요금 대비 50% 할인된 가격입니다.
-
-
사용자 지정 모델 가져오기
-
사용자 지정 모델 가져오기
-
Llama
-
멀티모달 Llama
-
Mistral
-
Mixtral
-
Flan
-
Qwen
-
OpenAI
-
Llama
-
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.05718 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 리전: 유럽(프랑크푸르트)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.07144 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 참고: 모델을 호스팅하는 데 필요한 사용자 지정 모델 단위는 모델 아키텍처, 모델 파라미터 수, 컨텍스트 길이 등 다양한 요소에 따라 달라집니다. 필요한 사용자 지정 모델 단위의 정확한 수는 가져올 때 결정됩니다. 참고로 Llama 3.1 8B 128K 모델에는 2 사용자 지정 모델 단위가 필요하고, Llama 3.1 70B 128k 모델에는 8 사용자 지정 모델 단위가 필요합니다.
*5분 단위로 청구
-
멀티모달 Llama
-
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.05718 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 리전: 유럽(프랑크푸르트)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.07144 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 참고: 모델을 호스팅하는 데 필요한 사용자 지정 모델 단위는 모델 아키텍처, 모델 파라미터 수, 컨텍스트 길이 등 다양한 요소에 따라 달라집니다. 필요한 사용자 지정 모델 단위의 정확한 수는 가져올 때 결정됩니다. 참고로 Llama 3.1 8B 128K 모델에는 2 사용자 지정 모델 단위가 필요하고, Llama 3.1 70B 128k 모델에는 8 사용자 지정 모델 단위가 필요합니다.
*5분 단위로 청구
-
Mistral
-
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.05718 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 리전: 유럽(프랑크푸르트)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.07144 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 참고: 모델을 호스팅하는 데 필요한 사용자 지정 모델 단위는 모델 아키텍처, 모델 파라미터 수, 컨텍스트 길이 등 다양한 요소에 따라 달라집니다. 필요한 사용자 지정 모델 단위의 정확한 수는 가져올 때 결정됩니다. 참고로 Llama 3.1 8B 128K 모델에는 2 사용자 지정 모델 단위가 필요하고, Llama 3.1 70B 128k 모델에는 8 사용자 지정 모델 단위가 필요합니다.
*5분 단위로 청구
-
Mixtral
-
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.05718 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 리전: 유럽(프랑크푸르트)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.07144 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 참고: 모델을 호스팅하는 데 필요한 사용자 지정 모델 단위는 모델 아키텍처, 모델 파라미터 수, 컨텍스트 길이 등 다양한 요소에 따라 달라집니다. 필요한 사용자 지정 모델 단위의 정확한 수는 가져올 때 결정됩니다. 참고로 Llama 3.1 8B 128K 모델에는 2 사용자 지정 모델 단위가 필요하고, Llama 3.1 70B 128k 모델에는 8 사용자 지정 모델 단위가 필요합니다.
*5분 단위로 청구
-
Flan
-
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.05718 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 리전: 유럽(프랑크푸르트)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.07144 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 참고: 모델을 호스팅하는 데 필요한 사용자 지정 모델 단위는 모델 아키텍처, 모델 파라미터 수, 컨텍스트 길이 등 다양한 요소에 따라 달라집니다. 필요한 사용자 지정 모델 단위의 정확한 수는 가져올 때 결정됩니다. 참고로 Llama 3.1 8B 128K 모델에는 2 사용자 지정 모델 단위가 필요하고, Llama 3.1 70B 128k 모델에는 8 사용자 지정 모델 단위가 필요합니다.
*5분 단위로 청구
온디맨드 추론 요금:
성공적인 첫 번째 간접 호출부터 시작하여 모델 사본이 활성화된 기간 동안 5분 단위로 요금이 청구됩니다. 모델 사본당 최대 처리량 및 동시성 한도는 입력/출력 토큰 믹스, 하드웨어 유형, 모델 크기, 아키텍처, 추론 최적화와 같은 요소에 따라 달라지며 모델 가져오기 워크플로 중에 결정됩니다.Bedrock은 사용 패턴에 따라 모델 사본 수를 자동으로 조정합니다. 5분 동안 간접 호출이 없는 경우 모델을 간접적으로 호출할 때 Bedrock은 0으로 스케일 다운했다가 다시 스케일 업합니다. 다시 스케일 업하는 동안 모델 크기에 따라 콜드 스타트 지속 시간(수십 초)이 발생할 수 있습니다. 또한 Bedrock은 추론 볼륨이 단일 모델 사본의 동시성 한도를 지속적으로 초과하는 경우 모델 사본 수를 스케일 업합니다. 참고: 계정별 가져온 모델당 기본 최대 3개의 모델 사본이 있으며, Service Quotas를 통해 늘릴 수 있습니다.
-
Qwen
-
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.05718 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 리전: 유럽(프랑크푸르트)
사용자 지정 모델 단위 버전 v1.0 사용자 지정 모델 단위당 분당 요금* 0.07144 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 참고: 모델을 호스팅하는 데 필요한 사용자 지정 모델 단위는 모델 아키텍처, 모델 파라미터 수, 컨텍스트 길이 등 다양한 요소에 따라 달라집니다. 필요한 사용자 지정 모델 단위의 정확한 수는 가져올 때 결정됩니다. 참고로 Llama 3.1 8B 128K 모델에는 2 사용자 지정 모델 단위가 필요하고, Llama 3.1 70B 128k 모델에는 8 사용자 지정 모델 단위가 필요합니다.
*5분 단위로 청구
온디맨드 추론 요금:
성공적인 첫 번째 간접 호출부터 시작하여 모델 사본이 활성화된 기간 동안 5분 단위로 요금이 청구됩니다. 모델 사본당 최대 처리량 및 동시성 한도는 입력/출력 토큰 믹스, 하드웨어 유형, 모델 크기, 아키텍처, 추론 최적화와 같은 요소에 따라 달라지며 모델 가져오기 워크플로 중에 결정됩니다.Bedrock은 사용 패턴에 따라 모델 사본 수를 자동으로 조정합니다. 5분 동안 간접 호출이 없는 경우 모델을 간접적으로 호출할 때 Bedrock은 0으로 스케일 다운했다가 다시 스케일 업합니다. 다시 스케일 업하는 동안 모델 크기에 따라 콜드 스타트 지속 시간(수십 초)이 발생할 수 있습니다. 또한 Bedrock은 추론 볼륨이 단일 모델 사본의 동시성 한도를 지속적으로 초과하는 경우 모델 사본 수를 스케일 업합니다. 참고: 계정별 가져온 모델당 기본 최대 3개의 모델 사본이 있으며, Service Quotas를 통해 늘릴 수 있습니다.
-
OpenAI
-
리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)
사용자 지정 모델 단위 버전 v2.0 사용자 지정 모델 단위당 분당 요금* 0.1433 USD 사용자 지정 모델 단위당 월별 스토리지 비용 1.95 USD 참고: 모델을 호스팅하는 데 필요한 사용자 지정 모델 단위는 모델 아키텍처, 모델 파라미터 수, 컨텍스트 길이 등 다양한 요소에 따라 달라집니다. 필요한 사용자 지정 모델 단위의 정확한 수는 가져올 때 결정됩니다. 참고로 Llama 3.1 8B 128K 모델에는 2 사용자 지정 모델 단위가 필요하고, Llama 3.1 70B 128k 모델에는 8 사용자 지정 모델 단위가 필요합니다.
*5분 단위로 청구
온디맨드 추론 요금:
성공적인 첫 번째 간접 호출부터 시작하여 모델 사본이 활성화된 기간 동안 5분 단위로 요금이 청구됩니다. 모델 사본당 최대 처리량 및 동시성 한도는 입력/출력 토큰 믹스, 하드웨어 유형, 모델 크기, 아키텍처, 추론 최적화와 같은 요소에 따라 달라지며 모델 가져오기 워크플로 중에 결정됩니다.Bedrock은 사용 패턴에 따라 모델 사본 수를 자동으로 조정합니다. 5분 동안 간접 호출이 없는 경우 모델을 간접적으로 호출할 때 Bedrock은 0으로 스케일 다운했다가 다시 스케일 업합니다. 다시 스케일 업하는 동안 모델 크기에 따라 콜드 스타트 지속 시간(수십 초)이 발생할 수 있습니다. 또한 Bedrock은 추론 볼륨이 단일 모델 사본의 동시성 한도를 지속적으로 초과하는 경우 모델 사본 수를 스케일 업합니다. 참고: 계정별 가져온 모델당 기본 최대 3개의 모델 사본이 있으며, Service Quotas를 통해 늘릴 수 있습니다.
-
-
-
Knowledge Bases
-
Structured Data Retrieval(SQL 생성)
Structured Data Retrieval은 SQL 쿼리를 생성하기 위한 각 요청에 대해 요금이 부과됩니다. 생성된 SQL 쿼리는 정형 데이터 스토어에서 데이터를 검색하는 데 사용됩니다.
순위 조정 모델
순위 조정 모델은 검색 증강 생성(RAG) 애플리케이션에서 응답의 관련성과 정확도를 개선하도록 설계되었습니다. 쿼리당 요금이 부과됩니다.
**쿼리에 최대 100개의 문서 청크를 포함할 수 있는 쿼리 수에 대해 요금이 부과됩니다. 쿼리에 100개가 넘는 문서 청크가 포함된 경우 여러 쿼리로 계산됩니다. 예를 들어 350개의 문서가 포함된 요청은 4개의 쿼리로 처리됩니다. 각 문서는 최대 512개의 토큰(쿼리 및 문서의 총 토큰 포함)만 포함할 수 있으며, 토큰 길이가 512개 토큰보다 크면 여러 문서로 분류된다는 점에 유의하세요. 쿼리는 검색 단위와 동등합니다.
-
가드레일
-
Amazon Bedrock Guardrails
Amazon Bedrock Guardrails 요금은 가드레일에 사용된 필터로 인해 발생하는 요금을 기준으로 합니다. 요금은 표준 등급과 클래식 등급 모두 동일합니다.
가드레일 필터*
요금
표준 등급 및 클래식 등급 모두에 대한 콘텐츠 필터(텍스트 콘텐츠) 텍스트 단위 1,000개당 0.15 USD
콘텐츠 필터(이미지 콘텐츠)
처리된 이미지당 0.00075 USD
표준 등급과 클래식 등급 모두에 대한 거부된 주제
텍스트 단위 1,000개당 0.15 USD
민감한 정보 필터
텍스트 단위 1,000개당 0.10 USD
민감한 정보 필터(정규식)
무료
단어 필터
무료
상황별 근거 확인
텍스트 단위 1,000개당 0.10 USD
자동 추론 검사
자동 추론 정책당 텍스트 단위 1,000개당 0.17 USD
온디맨드 요금
* 각 가드레일 필터는 선택 사항이며 애플리케이션 요구 사항에 따라 활성화할 수 있습니다. 가드레일에 사용된 필터 유형을 기준으로 요금이 부과됩니다. 예를 들어 콘텐츠 필터와 거부된 주제로 가드레일을 구성한 경우 이 두 필터에 대한 요금이 부과되지만 민감한 정보 필터와 관련된 요금은 부과되지 않습니다.
참고: 텍스트 단위 1개는 최대 1,000자를 포함할 수 있습니다. 1,000자를 초과하는 텍스트 입력은 각각 1,000자 이하를 포함하는 다중 텍스트 단위로 처리됩니다. 예를 들어 텍스트 입력에 5,600자가 포함된 경우 6개의 텍스트 단위에 대한 요금이 부과됩니다.상황별 근거 확인은 참조 소스와 쿼리를 사용하여 모델 응답이 소스를 기반으로 하고 있고 쿼리와 관련이 있는지 여부를 확인합니다. 비용이 청구되는 총 텍스트 단위 수는 소스, 쿼리 및 모델 응답의 모든 문자를 결합하여 계산됩니다.
-
모델 평가
-
모델 평가
선택한 모델에서의 추론에 대해 모델 평가 요금이 부과됩니다. 자동으로 생성된 알고리즘 점수는 추가 비용 없이 제공됩니다. 자체 워크스트림을 사용하는 인간 기반 평가의 경우 평가의 모델 추론에 대한 비용이 청구되며, 완료된 인간 태스크당 0.21 USD의 요금이 부과됩니다.
모델 평가에서 RAG 평가 또는 평가형 LLM을 사용하는 경우, 심사자 모델이 사용하는 토큰에는 온디맨드 Standard 티어 가격을 기준으로 요금이 부과됩니다. 심사자 프롬프트는 토큰 사용량의 일부로 요금이 부과되며 공개 설명서에서 확인할 수 있습니다. Bedrock 지식 베이스에 대한 RAG 평가 시 Bedrock 지식 베이스의 일반 사용량 요금도 발생합니다.
모델
입력 토큰 1,000개당 요금
출력 토큰 1,000개당 요금
인간 태스크당 비용
평가를 위해 선택한 모델
선택한 모델 기준
선택한 모델 기준
0.21 USD
-
데이터 자동화
-
Data Automation
Amazon Bedrock Data Automation은 지능적인 문서 처리, 동영상 분석, RAG 등의 사용 사례에 맞게 비정형 멀티모달 콘텐츠를 정형 데이터 형식으로 변환합니다. Bedrock Data Automation은 동영상의 장면별 설명, 오디오 대본 또는 자동화된 문서 분석과 같이 양식에 따라 미리 정의된 기본값을 사용하여 표준 출력 콘텐츠를 생성할 수 있습니다. 고객은 기존 데이터베이스 또는 데이터 웨어하우스에 쉽게 로드할 수 있는 자체 데이터 스키마를 기반으로 블루프린트에서 출력 요구 사항을 지정하여 사용자 지정 출력을 추가로 생성할 수 있습니다. Knowledge Bases와의 통합을 통해 Bedrock Data Automation은 RAG 애플리케이션의 콘텐츠를 분석하는 데도 사용될 수 있으며, 이미지와 텍스트 모두에 들어 있는 정보를 포함함으로써 결과의 정확성과 관련성을 개선할 수 있습니다.
Amazon Bedrock Knowledge Bases는 Bedrock Data Automation 통합을 제공하여 멀티모달 데이터에 대해 더 연관성이 높고 정확한 응답을 제공합니다. Knowledge Base를 설정할 때 Bedrock Data Automation을 구문 분석 방법으로 선택하여 그림, 차트 및 다이어그램을 포함할 수 있는 이미지 또는 문서에서 의미 있는 인사이트를 분석하고 추출할 수 있습니다. Bedrock Data Automation은 처리 중에 수집된 문서와 이미지에서 의미 있는 정보를 추출하고, 이 정보는 청크, 임베딩 및 스토리지를 위한 후속 Knowledge Base 단계에서 사용됩니다. Bedrock Data Automation은 Knowledge Bases와 통합될 경우 표준화된 출력을 제공하고 비용을 청구합니다.
-
지능형 프롬프트 라우팅
-
가격 요금 항목 요금제 지능형 프롬프트 라우팅 요청 1,000건당 1 USD 온디맨드 지능형 프롬프트 라우팅
지능형 프롬프트 라우팅을 사용하면 동일한 모델 제품군의 여러 파운데이션 모델(FM) 조합을 사용하여 품질과 비용을 최적화할 수 있습니다. 예를 들어 Amazon Bedrock에서 Anthropic의 Claude 모델 제품군을 사용하면 프롬프트의 복잡성에 따라 Claude 3.5 Sonnet과 Claude 3 Haiku의 요청을 지능적으로 라우팅할 수 있습니다. 마찬가지로, Amazon Bedrock은 Meta Llama 3.3 70B 및 3.18B와 Nova Pro 및 Nova Lite 간에 요청을 라우팅할 수 있습니다. 프롬프트 라우터는 각 요청에 대해 최상의 성능을 제공하는 모델을 예측하는 동시에 응답 품질과 비용을 최적화하는 데 유용합니다. 이 기능을 통해 복잡하지 않은 쿼리는 더 작고 빠르며 비용 효율적인 모델로 처리할 수 있고 복잡한 쿼리는 더 성능이 뛰어난 모델로 라우팅할 수 있으므로 고객 서비스 어시스턴트와 같은 애플리케이션에 특히 유용합니다. Intelligent Prompt Routing은 정확도 저하 없이 비용을 최대 30% 절감할 수 있습니다.
-
프롬프트 최적화
-
Amazon Bedrock의 프롬프트 최적화
입력 프롬프트와 최적화된 프롬프트의 토큰 수를 기준으로 요금이 부과됩니다.
모든 요금은 2025년 4월 23일부터 매월 청구됩니다.
토큰 1,000개당 요금 0.030 USD
요금 예
-
AI21 Labs
애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. AI21의 Jurassic-2 Mid 모델에 입력 텍스트의 토큰 입력 1만 개를 토큰 출력 2천 개로 요약하는 요청을 수행합니다.
총 발생 비용 = 토큰 1만 개/1,000 * 0.0125 USD + 토큰 2,000개/1,000 * 0.0125 USD = 0.15 USD
-
Amazon
온디맨드 요금
애플리케이션 개발자가 Amazon Bedrock에 시간당 다음과 같은 API 직접 호출을 수행합니다. Amazon Titan Text Lite 모델에 입력 텍스트의 토큰 입력 2,000개를 토큰 출력 1,000개로 요약하는 요청을 수행합니다.
시간당 총 발생 비용 = 토큰 2,000 개/1,000 * 0.0003 USD + 토큰 1,000 개/1,000 * 0.0004 USD = 0.001 USD
애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Amazon Titan Image Generator 기본 모델에 표준 품질 크기의 1024 x 1024 이미지 1,000개를 생성하는 요청을 수행합니다.
총 발생 비용 = 이미지 1,000개 * 이미지당 0.01 USD = 10 USD
사용자 지정(미세 조정 및 지속적인 사전 훈련) 요금
애플리케이션 개발자가 1,000개의 이미지-텍스트 쌍을 사용하여 Amazon Titan Image Generator 모델을 사용자 지정합니다. 훈련 후 개발자는 1시간 동안 사용자 지정 모델 프로비저닝 처리량을 사용하여 모델의 성능을 평가합니다. 미세 조정된 모델은 1개월 동안 저장됩니다. 평가 후 개발자는 프로비저닝된 처리량(1개월 약정 기간)을 사용하여 사용자 지정 모델을 호스팅합니다.
미세 조정에 대한 월별 발생 비용 = 미세 조정 훈련(0.005 USD * 500 * 64). 여기서 0.005 USD는 이미지당 요금, 500은 단계 수, 64는 배치 크기 + 월별 사용자 지정 모델 스토리지(1.95 USD) + 사용자 지정 모델 추론 1시간(21 USD) = 160 USD + 1.95 USD + 21 = 182.95 USD
프로비저닝된 처리량 요금
애플리케이션 개발자가 텍스트 요약 사용 사례에 대해 1개월 약정으로 Amazon Titan Text Express의 모델 단위 2개를 구입합니다.
월별 총 발생 비용 = 모델 단위 2개 * 18.40 USD/시간 * 24시간* 31일 = 2만 7,379.20 USD
애플리케이션 개발자가 1개월 약정으로 기본 Amazon Titan Image Generator 모델의 모델 단위 1개를 구입합니다.
총 발생 비용 = 모델 단위 1개 * 16.20 USD * 24시간 * 31일 = 1만 2,052.80 USD
-
Amazon Bedrock 가드레일
예제 1: 고객 지원 챗봇
애플리케이션 개발자가 고객 지원 챗봇을 만듭니다. 콘텐츠 필터를 사용하여 유해한 콘텐츠와 거부된 주제를 차단하여 원하지 않는 쿼리 및 응답을 필터링합니다.
챗봇은 시간당 사용자 쿼리 1,000개를 처리합니다. 각 사용자 쿼리의 평균 입력 길이는 200자이고 FM 응답은 1,500자입니다.
각 사용자 쿼리의 200자는 텍스트 단위 1개에 해당합니다.
각 FM 응답의 1,500자는 텍스트 단위 2개에 해당합니다.
시간당 처리되는 텍스트 단위 = (1 + 2) * 쿼리 1,000개 = 텍스트 단위 3,000개
콘텐츠 필터 및 거부된 주제에 대해 시간당 발생한 총 비용 = 3,000 * (0.15 USD + 0.15 USD) / 1,000 = 0.90 USD예제 2: 고객 센터 트랜스크립트 요약
애플리케이션 개발자가 사용자와 지원 에이전트 간의 채팅 기록을 요약하는 애플리케이션을 만듭니다. 민감한 정보 필터를 사용하여 대화 1만 개에 대해 생성된 요약에서 개인 식별 정보(PII)를 삭제합니다.
생성된 각 요약에는 평균 3,500자가 포함되며 이는 텍스트 단위 4개에 해당합니다.
1만 개의 대화를 요약하는 데 발생한 총 비용 = 1만 * 4 * (0.1/1,000 USD) = 4 USD예제 3: 임상 시험 확인 엔진
한 의료 서비스 회사에서 의료 지침을 기준으로 치료 제안을 검증하기 위해 임상 의사 결정 지원 시스템에 자동 추론 검사를 구현합니다.이 시스템은 매달 환자 5,000명을 처리합니다. 각 사례의 포함 내용은 다음과 같습니다.
- 환자 데이터 요약: 500자(텍스트 단위 1개)
- 진단 평가: 2,000자(텍스트 단위 2개)
- 치료 권장 사항: 4,500자(텍스트 단위 5개)
월별 처리되는 텍스트 단위 = (1 + 2 + 5) 사례 5,000개 = 텍스트 단위 40,000개
자동 추론 검사에 발생하는 월별 총비용 = 40,000 (0.17 USD) / 1000 = 6.80 USD -
Amazon Bedrock Knowledge Bases
요금 예제 1(Amazon Rerank 1.0 모델을 사용한 순위 조정)
Amazon Rerank 1.0 모델을 사용하여 한 달에 순위 조정 API에 2백만 건의 요청을 보냅니다. 즉, 1백만 건의 요청에는 각각 100개 미만의 문서가 포함되어 있으므로 각 요청에 대해 요금이 부과됩니다. 나머지 1백만 개의 요청에는 120~150개의 문서가 포함되므로 각 요청에는 요청 2개에 대한 요금이 부과됩니다.
요청 1회당 요금 = 0.001 USD
총 요금 = 100만 * 0.001 USD + 100만*2*0.001 USD = 3,000 USD요금 예제 2: (정형 데이터 검색)
애플리케이션 개발자가 Amazon Redshift에 저장된 정형 데이터를 쿼리하는 지원 챗봇을 생성합니다. 개발자는 Bedrock Knowledge Base를 만들고 Amazon Redshift에 연결합니다. 챗봇은 시간당 사용자 쿼리 1만 개를 처리합니다. 사용자 쿼리에서 SQL을 생성하는 데 드는 각 사용자 쿼리의 비용은 GenerateQuery API당 0.002 USD입니다.
시간당 SQL 생성에 소요되는 총 비용 = 0.002 USD*1만 = 20 USD.
월별 발생한 총 비용 = 20 USD*24*30 = 1,440 USD -
Anthropic
온디맨드 요금
애플리케이션 개발자가 미국 서부(오레곤) 리전의 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Anthropic의 Claude 모델에 입력 텍스트의 토큰 입력 1만 1,000개를 토큰 출력 4,000개로 요약하는 요청을 수행합니다.
총 발생 비용 = 토큰 1만 1,000개/1,000 * 0.008 USD + 토큰 4,000개/1,000 * 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD
프로비저닝된 처리량 요금
애플리케이션 개발자가 미국 서부(오레곤) 리전에서 Anthropic Claude Instant의 모델 단위 1개를 구입합니다.
월별 총 발생 비용 = 모델 단위 1개 * 39.60 USD * 24시간 * 31일 = 2만 9,462.40 USD
-
Cohere
온디맨드 요금
애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Cohere의 Command 모델에 입력 텍스트의 토큰 입력 6,000개를 토큰 출력 2,000개로 요약하는 요청을 수행합니다.
총 발생 비용 = 토큰 6,000개/1,000 * 0.0015 USD+ 토큰 2,000개/1,000 * 0.0020 USD = 0.013 USD
애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Cohere의 Command-Light 모델에 입력 텍스트의 토큰 입력 6,000개를 토큰 출력 2,000개로 요약하는 요청을 수행합니다.
총 발생 비용 = 토큰 6,000개/1,000 * 0.0003 USD + 토큰 2,000개/1,000 * 0.0006 USD = 0.003 USD
애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Cohere의 Embed English 또는 Embed Multilingual 모델에 입력 토큰 1만 개에 대한 임베딩을 생성하는 요청을 수행합니다.
총 발생 비용 = 토큰 1만 개/1,000 * 0.0001 USD = 0.001 USD
사용자 지정(미세 조정) 요금
애플리케이션 개발자가 1,000개의 데이터 토큰을 사용하여 Cohere Command 모델을 사용자 지정합니다. 훈련 후 1시간 동안 사용자 지정 모델 프로비저닝 처리량을 사용하여 모델의 성능을 평가합니다. 미세 조정된 모델은 1개월 동안 저장됩니다. 평가 후 개발자는 프로비저닝된 처리량(1개월 약정)을 사용하여 사용자 지정 모델을 호스팅합니다.
미세 조정에 대해 발생한 월별 비용 = 미세 조정 훈련(0.004 USD * 1,000) +월별 사용자 지정 모델 스토리지(1.95 USD) + 사용자 지정 모델 추론 1시간(49.50 USD) = 55.45 USD
사용자 지정 모델의 프로비저닝된 처리량(1개월 약정)에 대해 발생한 월별 비용 = 39.60 USD
프로비저닝된 처리량 요금
애플리케이션 개발자가 텍스트 요약 사용 사례에 대해 1개월 약정으로 Cohere Command의 모델 단위 1개를 구입합니다.
월별 총 발생 비용 = 모델 단위 1개 * 39.60 USD * 24시간 * 31일 = 2만 9,462.40 USD
-
사용자 지정 모델 가져오기
요금 예시: 애플리케이션 개발자가 us-east-1 리전에서 8B 파라미터 크기에 128K 시퀀스 길이를 가진 사용자 지정 Llama 3.1 유형 모델을 가져오고 1개월 후에 해당 모델을 삭제합니다. 여기에는 2 사용자 지정 모델 단위가 필요합니다. 2 사용자 지정 모델 단위가 필요하므로 분당 가격은 0.1570 USD가 됩니다. 2 사용자 지정 모델 단위에 대한 모델 스토리지 비용은 해당 달에 3.90 USD입니다.
모델을 가져오는 데는 요금이 부과되지 않습니다. 첫 번째 성공적인 간접 호출은 오전 8시 3분이며, 이때 측정이 시작됩니다. 5분 측정 기간은 오전 8시 3분부터 오전 8시 7분, 오전 8시 7분부터 오전 8시 11분 등입니다. 5분 기간 중 하나 이상의 간접 호출이 있는 경우 해당 기간은 청구 대상 기간으로 간주됩니다. 오전 8시 3분에 간접 호출이 있고 오전 8시 7분 이후에 더 이상 간접 호출이 없는 경우 측정은 오전 8시 7분에 중지됩니다. 이 경우 청구서는 다음과 같이 계산됩니다. 0.1570 USD * 5분 * 1건의 5분 기간 = 0.785 USD
-
데이터 자동화
요금 예제 1:
BDA Custom Output을 사용하여 1,000페이지 문서를 처리한다고 가정해 보겠습니다. 1,000페이지 모두 15개의 필드가 있는 블루프린트 1을 사용하여 처리됩니다. 필드가 30개 이하인 모든 블루프린트의 페이지당 요금은 0.040 USD입니다. 총 비용은 40 USD입니다.
처리된 총 페이지 수 = 1,000
필드가 30개 미만인 블루프린트의 페이지당 요금 = 0.040 USD
총 요금 = 1,000 * 0.040 USD = 40 USD요금 예시 2:
BDA Custom Output을 사용하여 문서 2개를 처리한다고 가정해 보겠습니다. 문서 1은 40페이지로 구성되며 20개의 필드가 있는 블루프린트 1을 사용하여 처리됩니다. 문서 2는 10페이지로 구성되어 있으며 40개의 필드가 있는 블루프린트 2를 사용하여 처리됩니다. 블루프린트 1은 필드가 30개 이하이므로 페이지당 요금은 0.040 USD입니다. 블루프린트 2의 페이지당 요금은 0.045 USD입니다. 블루프린트 1을 사용하는 문서 1의 처리 비용은 1.60 USD입니다. 블루프린트 2를 사용하는 문서 2의 처리 비용은 0.45 USD입니다. 두 문서를 모두 처리하는 데 드는 총 비용은 2.05 USD입니다.
처리된 총 페이지 수 = 50
필드가 30개 미만인 블루프린트 1의 페이지당 요금 = 0.040 USD
40개 필드가 있는 블루프린트 2의 페이지당 요금 = 0.040 USD + (30개 이상의 추가 필드 수 *필드당 0.0005 USD)
30을 초과하는 추가 필드 수 = 40 - 30 = 10
40개 필드가 있는 블루프린트 2의 페이지당 요금 = 0.040 USD + (10 *필드당 0.0005 USD) = 0.045 USD
블루프린트 1을 사용한 문서 1에 대한 요금 = 40페이지 x 페이지당 0.040 USD = 1.6 USD
블루프린트 2를 사용한 문서 2 요금 = 10페이지 x 페이지당 0.045 USD = 0.45 USD
총 요금 = 문서 1에 대한 요금 + 문서 2에 대한 요금 = 1.6 USD + 0.45 USD = 2.05 USD요금 예제 3:
Bedrock Data Automation을 파서로 사용하도록 Bedrock Knowledge Bases를 설정한 다음 1,000페이지 분량의 문서를 수집한다고 가정해 보겠습니다. 참고: Knowledge Bases 구문 분석 옵션에 따라 비용 구조가 다릅니다. BDA는 페이지당 요금을 사용하는 반면, 파운데이션 모델 파서는 입력 및 출력 토큰을 기반으로 요금을 청구합니다. 컨텍스트의 경우 1,000페이지(30%는 표, 30%는 그림 포함)를 처리하려면 일반적으로 입력 토큰 2,900개와 출력 토큰 750개가 필요합니다. 토큰 소비량은 콘텐츠 유형에 따라 다르므로 자체 데이터로 테스트하여 더 정확한 추정치를 계산하는 것이 좋습니다. Bedrock Knowledge Bases와 Bedrock Data Automation 통합은 표준 출력을 사용하며, 페이지당 요금은 0.010 USD입니다. 총 비용은 10 USD입니다.처리된 총 페이지 수 = 1,000
표준 출력 페이지당 요금 = 0.010 USD
총 요금 = 1,000 * 0.010 USD = 10 USD요금 예제 4:
BDA Standard Output을 사용하여 60분짜리 비디오를 처리한다고 가정해 보겠습니다. 비디오 표준 출력의 분당 요금은 0.050 USD입니다. 총 비용은 3.00 USD입니다.
총 처리 시간 = 60분
비디오 표준 출력의 분당 가격 = 0.050 USD
총 요금 = 60 * 0.050 USD = 3.00 USD요금 예제 5:
BDA Custom Output을 사용하여 이미지 2,000개를 처리한다고 가정해 보겠습니다. 처음 1,000개의 이미지는 10개 필드로 구성된 블루프린트 1을 사용하여 처리됩니다. 마지막 1,000페이지는 40개 필드로 구성된 블루프린트 2를 사용하여 처리됩니다. 블루프린트 1은 필드가 30개 이하이므로 이미지당 가격은 0.005 USD입니다. 블루프린트 2의 이미지당 가격은 0.01 USD입니다. 블루프린트 1을 사용하는 첫 1,000개 이미지의 처리 비용은 5.00 USD입니다. 블루프린트 2를 사용하는 두 번째 1,000개 이미지의 처리 비용은 10.00 USD입니다. 2,000개의 이미지를 모두 처리하는 데 드는 총 비용은 15.00 USD입니다.
처음 1,000개 이미지에 대한 비용 = 이미지 1,000개* 이미지당 0.005 USD = 5.00 USD
두 번째 1,000개 이미지에 대한 비용 = 이미지 1,000개 * (0.005 USD+ (30개 이상의 추가 필드 수 *필드당 0.0005 USD))
= 1,000 * (0.005 USD + ((40-30)*0.0005 USD))
= 1,000 * (0.005 USD + (10*0.0005 USD)) = 10.00 USD
총 비용 = 5.00 USD + 10.00 USD = 15 USD요금 예제 6:
Bedrock Data Automation Standard Output을 사용하여 조직에서 1만 5,000분 분량의 회의 오디오 녹음을 처리한다고 가정해 보겠습니다. 1만 5,000분의 오디오 시간을 모두 처리하는 데 드는 총 비용은 90 USD입니다.
총 처리 시간(분) = 1만 5,000분
총 요금 = 1만 5,000분 × 0.006 USD = 90 USD -
DeepSeek
온디맨드 요금
애플리케이션 개발자가 Amazon Bedrock에 시간당 다음과 같은 API 직접 호출을 수행합니다. DeepSeek-R1 모델에 입력 텍스트의 토큰 입력 2,000개를 토큰 출력 1,000개(추론 토큰 포함)로 요약하는 요청을 수행합니다.
시간당 총 발생 비용 = 토큰 2,000개/1,000 * 0.00135 USD + 토큰 1,000개/1,000 * 0.0054 USD = 0.0081 USD
-
흐름
예: 뉴스 요약
한 애플리케이션 개발자가 트레이더를 위한 뉴스 요약을 자동화하는 흐름을 생성합니다. 흐름에는 S3 위치를 가져오는 입력 노드와 S3에 있는 10개 주요 통신사의 기사가 포함된 파일 10개를 검색하는 S3 검색 노드가 포함됩니다(2개 노드 전환). 그런 다음 반복기 노드를 사용하여 각 파일(+ 10개 파일 x 2개 노드 전환)을 요약하는 프롬프트 노드가 있는 모델을 간접적으로 호출합니다. 그런 다음 수집기 노드를 사용하여 모든 결과를 수집하고, S3 스토리지 노드를 사용하여 결과를 S3에 쓰고, 출력 노드에서 완료합니다(+ 3개 노드 전환). 이 개발자는 평일에 30분마다 이 흐름을 실행합니다.흐름 실행당 노드 전환 수는 다음과 같습니다. 2+1+10*2 + 3 = 25개 노드 전환/흐름 실행
월별 흐름 실행 수: 24시간 * 2 * 5일 * 4주 = 960회 흐름 실행/월.
월별 청구서 총액: 25 * 960 * 0.035 USD/1,000 = 0.84 USD
추가 요금
청구서에는 검색 및 스토리지 노드에서의 Amazon S3 사용량, 프롬프트 노드에서의 Amazon Bedrock 파운데이션 모델 사용량을 포함하여 워크플로 실행에 사용되는 AWS 서비스에 대한 추가 요금도 포함됩니다. -
Meta
온디맨드 요금
애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Meta의 Lama 2 Chat(13B) 모델에 입력 텍스트의 토큰 입력 2,000개를 토큰 출력 500개로 요약하는 요청을 수행합니다.
총 발생 비용 = 토큰 2,000개/1,000 * 0.00075 USD + 토큰 500개/1,000 * 0.001 USD = 0.002 USD
사용자 지정(미세 조정) 요금
애플리케이션 개발자가 1,000개의 데이터 토큰을 사용하여 Lama 2 Pretrained(70B) 모델을 사용자 지정합니다. 훈련 후 1시간 동안 사용자 지정 모델 프로비저닝 처리량을 사용하여 모델의 성능을 평가합니다. 미세 조정된 모델은 1개월 동안 저장됩니다. 평가 후 개발자는 프로비저닝된 처리량(1개월 약정)을 사용하여 사용자 지정 모델을 호스팅합니다.
미세 조정에 대해 발생한 월별 비용 = 미세 조정 훈련(0.00799 USD * 1,000) +월별 사용자 지정 모델 스토리지(1.95 USD) + 사용자 지정 모델 추론 1시간(23.50 USD) = 33.44 USD
사용자 지정 모델의 프로비저닝된 처리량(1개월 약정)에 대해 발생한 월별 비용 = 21.18 USD
프로비저닝된 처리량 요금
애플리케이션 개발자가 텍스트 요약 사용 사례에 대해 1개월 약정으로 Meta Lama 2의 모델 단위 1개를 구입합니다.
월별 총 발생 비용 = 모델 단위 1개 * 21.18 USD * 24시간 * 31일 = 1만 5,757.92 USD
-
Mistral AI
온디맨드 요금
애플리케이션 개발자가 Amazon Bedrock에 시간당 다음과 같은 API 직접 호출을 수행합니다. Mistral 7B 모델에 입력 텍스트의 토큰 입력 2,000개를 토큰 출력 1,000개로 요약하는 요청을 수행합니다.
시간당 총 발생 비용 = 토큰 2,000개/1,000 * 0.00015 USD + 토큰 1,000개/1,000 * 0.0002 USD = 0.0005 USD
애플리케이션 개발자가 Amazon Bedrock에 시간당 다음과 같은 API 직접 호출을 수행합니다. Mixtral 8x7B 모델에 입력 텍스트의 토큰 입력 2,000개를 토큰 출력 1,000개로 요약하는 요청을 수행합니다.
시간당 총 발생 비용 = 토큰 2,000개/1,000 * 0.00045 USD + 토큰 1,000개/1,000 * 0.0007 USD = 0.0016 USD
애플리케이션 개발자가 Amazon Bedrock에 시간당 다음과 같은 API 직접 호출을 수행합니다. Mistral 대용량 모델에 입력 텍스트의 토큰 입력 2,000개를 토큰 출력 1,000개로 요약하는 요청을 수행합니다.
시간당 총 발생 비용 = 토큰 2,000개/1,000 * 0.008 USD + 토큰 1,000개/1,000 * 0.024 USD = 0.04 USD
-
모델 평가
모델 평가 예제 1:
온디맨드 요금
애플리케이션 개발자가 미국 동부(버지니아 북부) AWS 리전에서 Anthropic Claude 2.1과 Anthropic Claude Instant를 사용하여 인간 기반 모델 평가를 위한 데이터세트를 제출합니다.데이터세트에는 프롬프트 50개가 포함되어 있으며 개발자는 작업자 1명에게 각 프롬프트-응답 세트를 평가하도록 합니다[평가 작업을 생성할 때 ‘workers per prompt(프롬프트당 작업자 수)’ 파라미터로 구성 가능].
이 평가 작업에는 태스크 50개가 포함됩니다(각 작업자당 각 프롬프트-응답 세트에 대한 태스크 1개) 프롬프트 50개가 합쳐져 입력 토큰 5,000개가 되고, 관련 응답을 합하면 Anthropic Claude Instant의 경우 토큰 1만 5,000개, Anthropic Claude 2.1의 경우 토큰 2만 개가 됩니다.
이 모델 평가 작업에서 발생하는 요금은 다음과 같습니다.항목 입력 토큰 수 입력 토큰 1,000개당 요금 입력 비용 출력 토큰 수 출력 토큰 1,000개당 요금 출력 비용 인간 태스크 수 인간 태스크당 비용 인간 태스크 비용 합계 Claude Instant 추론 5,000 0.0008 USD 0.004 USD 1만 5,000 0.0024 USD 0.036 USD 0.04 USD Claude 2.1 추론 5,000 0.008 USD 0.04 USD 2만 0.024 USD 0.48 USD 0.52 USD 인간 태스크 50 0.21 USD 10.50 USD 10.50 USD 합계 11.06 USD 모델 평가 예제 2:
온디맨드 요금
애플리케이션 개발자가 미국 동부(버지니아 북부) AWS 리전에서 Anthropic Claude 2.1과 Anthropic Claude Instant를 사용하여 인간 기반 모델 평가를 위한 데이터세트를 제출합니다.
데이터세트에는 프롬프트 50개가 포함되어 있으며 개발자는 작업자 2명에게 각 프롬프트-응답 세트를 평가하도록 합니다[평가 작업을 생성할 때 ‘workers per prompt(프롬프트당 작업자 수)’ 파라미터로 구성 가능]. 이 평가 작업에는 태스크 100개가 포함됩니다(각 작업자당 각 프롬프트-응답 세트에 대한 태스크 1개: 작업자 2명 x 프롬프트-응답 세트 50개 = 인간 태스크 100개).
프롬프트 50개가 합쳐져 입력 토큰 5,000개가 되고, 관련 응답을 합하면 Anthropic Claude Instant의 경우 토큰 1만 5,000개, Anthropic Claude 2.1의 경우 토큰 2만 개가 됩니다.
이 모델 평가 작업에서 발생하는 요금은 다음과 같습니다.항목 입력 토큰 수 입력 토큰 1,000개당 요금 입력 비용 출력 토큰 수 출력 토큰 1,000개당 요금 출력 비용 인간 태스크 수 인간 태스크당 비용 인간 태스크 비용 합계 Claude Instant 추론 5,000 0.0008 USD 0.0040 USD 1만 5,000 0.0024 USD 0.036 USD 0.04 USD Claude 2.1 추론 5,000 0.008 USD 0.0400 USD 2만 0.024 USD 0.48 USD 0.52 USD 인간 태스크 100 0.21 USD 21.00 USD 21.00 USD 합계 21.56 USD -
프롬프트 최적화
예: 뉴스 요약
애플리케이션 개발자가 Claude 3.5를 사용하는 트레이더를 위해 뉴스를 요약하는 프롬프트를 만듭니다. 원래 프롬프트에는 토큰 429개가 포함되어 있습니다. 최적화된 프롬프트에는 토큰 511개가 있으며 FM에서 보다 간결한 답변을 생성하기 위한 보다 구체적인 지침과 예제가 포함되어 있습니다. 이 개발자는 토큰 511개가 포함된 최적화된 프롬프트를 프롬프트 옵티마이저의 입력으로 사용하고 토큰 582개와 579개로 Claude 3.7과 Nova Pro의 새로운 변형 2개를 만듭니다.프롬프트 최적화를 위한 총 입력 및 출력 토큰 수: 429 + 511 + 511 + 582 + 511 + 579 = 3,123
월 요금 합계는 다음과 같습니다. 3,123/1,000 * 0.03 USD = 0.09 USD
-
Stability AI
온디맨드 요금
애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. SDXL 모델에 단계 크기가 70인 512 x 512 이미지(프리미엄 품질)를 생성하는 요청을 수행합니다.
총 발생 비용 = 이미지 1개 * 이미지당 0.036 USD = 0.036 USD
애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. SDXL 1.0 모델에 단계 크기가 70인 1024 x 1024 이미지(프리미엄 품질)를 생성하는 요청을 수행합니다.
총 발생 비용 = 이미지 1개 * 이미지당 0.08 USD = 0.08 USD
프로비저닝된 처리량 요금
애플리케이션 개발자가 1개월 약정으로 SDXL1.0의 모델 단위 1개를 구입합니다.
총 비용 = 1 * 49.86 USD * 24시간 * 31일 = 3만 7,095.84 USD
-
TwelveLabs
온디맨드 요금
애플리케이션 개발자가 Amazon Bedrock의 Pegasus 1.2 모델에 10초 길이 비디오의 내용 설명을 요청하는 API 직접 호출을 수행하고, 2,000개 토큰의 출력을 받습니다.
총 발생 비용 = 10초 * 0.00049 USD + 토큰 2,000개/1,000 * 0.0075 USD = 0.0199 USD
애플리케이션 개발자가 Amazon Bedrock의 Marengo Embed [3.0 또는 2.7] 모델에 비디오 10개를 임베딩하기 위해(시간 총합 100분) API 직접 호출을 수행합니다.총 발생 비용 = 100분(6,000초) * 0.00070 USD = 4.2 USD
애플리케이션 개발자가 Amazon Bedrock의 Marengo Embed 3.0 모델에 텍스트와 이미지를 함께 제공하여 주어진 이미지에 표시된 가방이 있는 클립을 위의 예시를 사용해 생성한 임베딩 리포지토리에서 찾는 데 사용할 수 있는 임베딩을 생성하기 위해 API 직접 호출을 수행합니다.총 발생 비용 = 텍스트 요청 1건 * 0.00007 USD + 이미지 요청 1건 * 0.0001 USD = 0.00017 USD
애플리케이션 개발자가 Amazon Bedrock의 Marengo Embed [3.0 또는 2.7] 모델에 위의 예시를 사용해 생성한 임베딩 리포지토리에서 일치하는 클립을 찾는 데 사용할 수 있는 임베딩을 생성하기 위해 텍스트를 제공하여 API 직접 호출을 수행합니다.총 발생 비용 = 텍스트 요청 1건 * 0.00007 USD = 0.00007 USD
-
Writer
애플리케이션 개발자가 Amazon Bedrock에 다음과 같은 API 직접 호출을 수행합니다. Writer의 Palmyra X5 모델에 입력 텍스트의 토큰 입력 1만 개를 토큰 출력 2천 개로 요약하는 요청을 수행합니다.
총 발생 비용 = 토큰 1만 개/1,000 * 0.003 USD + 토큰 2,000개/1,000 * 0.015 USD = 0.06 USD