Amazon Bedrock, Service Quotas에 대한 지원 확대

게시된 날짜: 2026년 5월 27일

Amazon Bedrock은 선도적인 AI 회사의 고성능 파운데이션 모델에 엔터프라이즈급 보안 액세스를 제공하는 완전 관리형 서비스로서, 이를 통해 생성형 AI 애플리케이션을 구축하고 확장할 수 있습니다. 이제 Amazon Bedrock 고객은 AWS Service Quotas를 통해 bedrock-mantle 엔드포인트에 대한 추론 할당량을 확인할 수 있습니다. 따라서 고객은 기존에 bedrock-runtime 엔드포인트와 기타 AWS 서비스에서 사용하던 방식과 동일하게 익숙하고 일관된 방법으로 이 엔드포인트에 대한 제한을 추적할 수 있으며, 워크로드에 적용되는 제한을 명확하게 가시화할 수 있습니다.

bedrock-mantle 엔드포인트는 OpenAI Responses API, OpenAI Chat Completions API, Anthropic Messages API를 지원하므로 고객은 최소한의 코드 변경만으로 기존 OpenAI 또는 Anthropic 기반 애플리케이션을 Amazon Bedrock에서 실행할 수 있습니다. 이제 AWS Service Quotas에서 지원되는 모델에 대한 분당 입력 토큰, 분당 출력 토큰 할당량을 엔드포인트에서 확인할 수 있습니다.

이번 출시를 통해 고객은 bedrock-mantle 엔드포인트에 대한 제한을 명확히 가시화하고 프로덕션 규모 조정을 사전에 계획할 수 있습니다. 시작하려면 AWS Service Quotas 콘솔을 열고 Amazon Bedrock을 선택한 다음 "Bedrock Mantle"을 검색하여 현재 할당량을 확인하세요. 이러한 할당량 증가를 요청하려면 표준 Amazon Bedrock 한도 증가 프로세스를 따르세요. bedrock-mantle 엔드포인트에 대한 Service Quotas 지원은 해당 엔드포인트가 제공되는 모든 AWS 리전, 즉 미국 동부(버지니아 북부, 오하이오), 미국 서부(오리건), 아시아 태평양(뭄바이, 도쿄, 시드니, 자카르타), 유럽(프랑크푸르트, 아일랜드, 런던, 밀라노, 스톡홀름), 남아메리카(상파울루)에서 사용할 수 있습니다. 자세한 내용은 Amazon Bedrock의 할당량을 참조하세요.