Amazon Bedrock AgentCore(평가판) 요금
AgentCore를 필요에 맞게 조정하세요. 서비스를 조합하고, 독립적으로 또는 함께 사용하고, AI 이니셔티브가 성장함에 따라 사용한 만큼만 비용을 지불하세요.
사용한 만큼만 비용 지불
Amazon Bedrock AgentCore는 사전 약정이나 최소 수수료 없이 유연한 사용량 기반 요금을 제공합니다. 각 서비스(런타임, 도구(브라우저, 코드 인터프리터), 게이트웨이, ID, 메모리, 관찰성)은 독립적으로 또는 함께 사용할 수 있으며 사용한 만큼만 비용을 지불하면 됩니다. 이 모듈식 접근 방식을 사용하면 소규모로 시작하여 AI 에이전트 애플리케이션이 성장함에 따라 확장할 수 있습니다.
2025년 9월 16일까지 무료로 AgentCore 서비스를 체험할 수 있습니다. 표준 AWS 요금은 AgentCore 사용의 일부로 사용되는 모든 추가 AWS 서비스에 적용됩니다(예: AgentCore 관찰성에는 CloudWatch 요금이 적용됨). 2025년 9월 17일부터 AWS는 이 페이지를 기반으로 AgentCore 서비스 사용량에 대해 요금을 청구합니다.
Bedrock AgentCore 서비스
런타임
AgentCore Runtime은 동적 AI 에이전트 및 도구를 배포하고 확장하기 위해 특별히 설계된 안전한 서버리스 런타임입니다.
사용량 기반 요금
리소스를 사전 구성할 필요 없이 사용한 만큼만 비용을 지불하면 됩니다. CPU 리소스의 경우 에이전트가 활성 처리 중일 때 요금이 부과됩니다(LLM 응답만 기다리는 경우 I/O 대기 기간 동안에는 요금이 청구되지 않음). 메모리 리소스의 경우 에이전트가 사용하는 메모리에 대해서만 요금이 부과됩니다.
주요 세부 정보:
- 사전 리소스 선택 불필요
- 요금은 해당 초 동안 기록된 가장 높은 CPU 및 메모리 사용량 값(최소 1초)을 사용하여 초당 계산됩니다.
- 128MB 최소 메모리 요금 청구 적용
- 고객 ENI를 통한 네트워크 데이터 전송에는 표준 EC2 요금이 청구됩니다.
브라우저
AI 에이전트가 대규모 웹 사이트와 상호 작용할 수 있도록 빠르고 안전한 클라우드 기반 브라우저 런타임을 제공합니다.
사용량 기반 요금
리소스를 사전 구성할 필요 없이 사용한 만큼만 비용을 지불하면 됩니다. CPU 리소스의 경우 도구가 활성 처리 중일 때만 요금이 부과됩니다(LLM 응답만 기다리는 경우 I/O 대기 기간 동안에는 요금이 청구되지 않음). 메모리 리소스의 경우 에이전트가 사용하는 메모리에 대해서만 요금이 부과됩니다.
주요 세부 정보:
- 사전 리소스 선택 불필요
- 요금은 해당 초 동안의 가장 높은 CPU 및 메모리 사용량 값 워터마크(최소 1초)를 사용하여 초당 계산됩니다.
- 128MB 최소 메모리 요금 청구 적용
- 고객 ENI를 통한 네트워크 데이터 전송에는 표준 EC2 요금이 청구됩니다.
코드 인터프리터
AgentCore Code Interpreter 도구를 사용하면 AI 에이전트가 샌드박스 환경에서 코드를 안전하게 작성하고 실행하여 정확도를 높이고 복잡한 종단 간 작업을 해결하는 능력을 확장할 수 있습니다.
사용량 기반 요금
리소스를 사전 구성할 필요 없이 사용한 만큼만 비용을 지불하면 됩니다. CPU 리소스의 경우 도구가 활성 처리 중일 때만 요금이 부과됩니다(LLM 응답만 기다리는 경우 I/O 대기 기간 동안에는 요금이 청구되지 않음). 메모리 리소스의 경우 에이전트가 사용하는 메모리에 대해서만 요금이 부과됩니다.
주요 세부 정보:
- 사전 리소스 선택 불필요
- 요금은 해당 초 동안의 가장 높은 CPU 및 메모리 사용량 값 워터마크(최소 1초)를 사용하여 초당 계산됩니다.
- 128MB 최소 메모리 요금 청구 적용
- 고객 ENI를 통한 네트워크 데이터 전송에는 표준 EC2 요금이 청구됩니다.
게이트웨이
AgentCore Gateway는 API, Lambda 함수 및 기존 서비스를 에이전트 호환 도구로 쉽게 변환할 수 있는 기능과 함께 에이전트가 도구를 검색하고 사용할 수 있는 안전한 방법을 제공합니다.
사용량 기반 요금
에이전트가 Gateway를 통해 거는 API 직접 호출에 대해서만 비용을 지불하면 됩니다. 도구 작업(ListTools 및 InvokeTool), 검색 쿼리, 시맨틱 검색 기능을 위해 인덱싱된 도구의 수를 기준으로 요금이 부과됩니다.
주요 세부 정보:
- 선결제 비용이나 최소 약정 불필요
- ListTools 및 InvokeTool API는 128KB 데이터 전송 단위로 측정됩니다.
ID
AgentCore Identity는 에이전트 ID 및 액세스 관리를 간소화하고, 에이전트가 사용자를 대신하여 또는 사전 승인된 사용자 동의를 얻어 스스로 AWS 리소스와 타사 도구 및 서비스에 안전하게 액세스할 수 있도록 합니다.
사용량 기반 요금
AgentCore Runtime 또는 AgentCore Gateway를 통해 AgentCore Identity를 사용하는 고객에게는 AgentCore Identity 사용에 대한 추가 요금이 발생하지 않습니다. 다른 모든 시나리오의 경우 사용한 만큼만 비용을 지불하며, 에이전트가 OAuth 토큰 또는 API 키에 대해 AgentCore Identity에 요청한 횟수를 기준으로 요금이 부과됩니다.
주요 세부 정보:
- 최소 요금 및 사전 약정 없음
- 결제액은 AWS 이외의 리소스에 대한 승인이 필요한 작업을 수행하기 위해 요청된 성공적인 OAuth 토큰 또는 API 키를 기준으로 계산됩니다.
- 고객이 AgentCore Runtime 또는 AgentCore Gateway를 통해 AgentCore Identity를 사용하는 경우 추가 요금이 발생하지 않습니다.
메모리
AgentCore Memory를 사용하면 복잡한 메모리 인프라 관리를 없애고 AI 에이전트가 기억하는 내용을 완전히 제어할 수 있으므로 개발자가 컨텍스트 인식 에이전트를 쉽게 구축할 수 있습니다.
사용량 기반 요금
사용한 만큼만 지불하면 됩니다. 요금은 단순하고 사용량을 기반으로 하며, AI 에이전트가 가치를 창출하는 방식에 직접적으로 부합합니다.
- 단기 메모리는 수집한 원시 이벤트의 수를 기준으로 가격이 책정되므로 세션 중 컨텍스트에 대한 비용을 예측할 수 있습니다.
- 장기 메모리에 대한 가격 책정 기준은 매월 저장된 메모리 수와 검색한 메모리 수입니다. 따라서 비용은 에이전트가 오래 유지되는 지식을 저장하고 사용할 때만 지불하면 됩니다.
- 원시 이벤트에서 장기 기억을 추출하려면 자동 처리를 포함하는 내장 메모리 전략을 선택하거나 선택한 모델 및 프롬프트를 사용하여 계정에서 실행되는 사용자 지정 메모리 전략 중에서 선택할 수 있습니다.
주요 세부 정보:
- 사전 리소스 선택 불필요
- 단기 메모리의 경우 결제 요금은 이벤트 생성 요청별로 계산됩니다.
- 장기 메모리 보관의 경우 결제 요금은 매일 저장된 메모리별로 계산한 후 해당 월 전체 평균을 구하는 방식으로 산출됩니다.
- 장기 메모리 검색의 경우 결제 요금은 검색 메모리 요청별로 계산됩니다.
관찰성
AgentCore Observability는 개발자에게 프로덕션 환경에서 AI 에이전트의 성능을 추적, 디버그 및 모니터링할 수 있는 에이전트 워크플로에 대한 완전한 가시성을 제공합니다.
사용량 기반 요금
에이전트를 위해 생성, 저장 및 쿼리된 원격 측정에 대해 사용한 만큼만 지불하면 됩니다. 텔레메트리 데이터는 Amazon CloudWatch 계정에 수집되어 저장됩니다. 데이터 수집 및 저장, 정보 검색 및 분석을 위한 쿼리, 로그의 민감한 데이터/PII 데이터 마스킹에 대한 요금이 부과됩니다. 요금 세부 정보를 검토하려면 Amazon CloudWatch 요금 페이지를 참조하십시오.
요금표
Service
|
Type
|
Resource
|
Price
|
|||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
런타임
|
|
|
|
|||||||||
브라우저 도구
|
|
|
|
|||||||||
코드 인터프리터
|
|
|
|
|||||||||
게이트웨이
|
|
|
|
|||||||||
ID
|
사용량 기반 |
비 AWS 리소스에 대한 토큰 또는 API 키 요청 |
에이전트가 요청한 토큰 또는 API 키 1,000개당 0.010 USD (참고: AgentCore Runtime 또는 AgentCore Gateway를 통해 고객이 AgentCore Identity를 사용하는 경우 추가 비용 없이 AgentCore Identity가 제공됨) |
|||||||||
메모리
|
|
|
|
|||||||||
관찰성
|
사용량 기반 |
로그, 지표 및 추적 |
*사용자 지정 메모리 추출 전략의 경우 계정의 모델 사용에 대한 추가 요금이 발생할 수 있습니다.
요금 예
런타임
예: 고객 지원 에이전트 배포
채팅과 이메일에서 사용자 문의를 해결하는 고객 지원 에이전트를 배치할 계획입니다. 에이전트는 주문 문제, 계정 확인 및 정책 설명을 처리합니다. RAG(검색 증강 생성)를 사용하여 제품 정책을 가져오고 MCP(모델 컨텍스트 프로토콜) 호환 도구를 사용하여 주문 상태를 쿼리하고 지원 티켓을 업데이트합니다. 각 에이전트 세션에는 벡터 저장소에 대한 RAG 호출 1회, MCP 도구 호출 2회(예: OrderAPI, TickeTAPI) 및 2개의 LLM 추론 단계를 포함하는 정교한 다단계 추론이 포함됩니다. 완전한 세션 격리와 몇 초 만에 수백만 세션으로 확장할 수 있는 유연성이 필요하기 때문에 AgentCore Runtime에 에이전트를 배포했습니다.
매월 1천만 개의 사용자 요청을 처리하고, 각 세션은 70%의 I/O 대기 시간으로 60초 동안 실행됩니다(예: LLM 응답 또는 내부 API의 네트워크 응답 대기). 각 에이전트 세션은 활성 처리 중에는 1vCPU를 사용하고 지속적으로 2GB 메모리를 사용합니다. 월 비용은 다음과 같이 분석됩니다.
세션당 CPU 비용: 18초(70% I/O 대기 시간으로 조정) × 1 vCPU × (0.0895 USD/3600) = 0.0004475 USD
세션당 메모리 비용: 60초 × 2GB × (0.00945 USD/3600) = 0.000315 USD
세션당 총 비용: 0.0007625 USD
월간 총액: 1천만 세션 × 0.0007625 USD= 7,625 USD
AgentCore Runtime의 사용량 기반 요금은 I/O 대기 기간이 아닌 활성 CPU 처리 시간에 대해서만 비용을 지불한다는 것을 의미하므로 기존 컴퓨팅 옵션에 비해 비용 효율성이 높습니다.
브라우저
예: 자동 여행 예약 시스템
웹 상호 작용을 통해 전체 여행 계획 및 예약을 자동화하는 여행 예약 AI 에이전트를 만들 계획입니다. 구현하려면 항공편, 호텔 검색, 클릭 시뮬레이션, 가격 추출, 예약 양식 제출을 위한 헤드리스 브라우저를 동적으로 관리할 수 있는 AgentCore Browser의 안전한 서버리스 런타임이 필요합니다. AgentCore 브라우저 도구는 세션 격리 샌드박스 컴퓨팅과 라이브 뷰 및 세션 재생을 통한 포괄적인 관찰성을 비롯한 엔터프라이즈급 기능을 제공합니다.
에이전트는 매월 10만 건의 요청을 처리합니다. 각 브라우저 세션은 80% I/O 대기 시간으로 10분 동안 실행되며 활성 처리 중에는 2vCPU를 사용하고 4GB 메모리를 지속적으로 사용합니다. 월 비용은 다음과 같이 분석됩니다.
세션당 CPU 비용: 120초(80% I/O 대기 시간으로 조정) × 2 vCPU × (0.0895 USD/3600) = 0.005967 USD
세션당 메모리 비용: 600초 × 4GB × (0.00945 USD/3600) = 0.0063 USD
세션당 총 비용: 0.012267 USD
월간 총액: 10만 세션 × 0.012267 USD = 1,226.67 USD
코드 인터프리터
예: 자연어 데이터 분석 자동화
데이터세트 쿼리, 시각화 및 통계 분석을 모두 자연어로 처리하여 비즈니스 및 제품 팀을 지원하는 데이터 분석가 에이전트를 배포할 계획입니다. 에이전트는 사이트 트래픽과 전환율 간의 상관관계 분석과 같은 복잡한 요청에 대해 Python 코드를 동적으로 생성하고 실행합니다. AgentCore Code Interpreter는 엔터프라이즈 보안 정책을 준수하는 격리된 샌드박스 환경, 다국어(JavaScript, TypeScript, Python)를 위한 사전 빌드된 실행 런타임, 대용량 파일 지원 등을 제공하므로 잘 활용할 수 있습니다.
에이전트는 요청당 코드 실행 3회로 매월 10,000건의 요청을 처리합니다. 각 실행은 2분 동안 진행되며 I/O 대기 시간은 60%이며, 활성 처리 중에는 2vCPU를 사용하고 4GB 메모리를 지속적으로 사용합니다. 월 비용은 다음과 같이 분석됩니다.
세션당 CPU 비용: 48초(I/O 대기 60%로 조정) × 2 vCPU × (0.0895 USD/3600) = 0.002387 USD
세션당 메모리 비용: 120초 × 4GB × (0.00945 USD/3600) = 0.00126 USD
세션당 총 비용: 0.003647 USD
월간 총액: 3만 건의 실행 건수 × 0.003647 USD = 109.40 USD
게이트웨이
예: HR 어시스턴트 에이전트를 내부 도구에 연결
내부 정책 질문, 휴가 잔여일, 복리후생 등록 및 급여 문의를 처리하는 중견기업을 위한 HR 어시스턴트 에이전트를 구축할 계획입니다. 사용자 요청을 처리하려면 에이전트가 여러 내부 시스템(온보딩, 복리후생, 급여 및 휴가 관리 API)을 도구로 액세스해야 합니다. AgentCore Gateway를 사용하여 200개의 내부 도구를 위한 MCP 서버를 생성했습니다. 이 MCP 서버는 에이전트가 코드를 작성하지 않고도 어디서든 상호 작용할 수 있습니다. 도구 사용의 정확도를 높이기 위해 검색 기능을 활용하여 도구 메타데이터를 인덱싱하고 상호 작용 컨텍스트를 기반으로 에이전트를 호출하는 동안 도구의 동적 매칭을 활성화했습니다.
각 에이전트 상호 작용에는 검색 API 1개와 InvokeTool API 간접 호출 4건이 필요합니다. 매월 5천만 건의 상호 작용으로 5천만 건의 검색과 2억 건의 InvokeTool 호출이 발생합니다. 월 비용은 다음과 같이 분석됩니다.
SearchToolIndex 요금: 도구 200개 × 도구 100개당 0.02 USD = 0.04 USD
검색 API 요금: 5천만 ×2,500만 USD = 1,250 USD
InvokeTool API 요금: 2억 × 500만 USD = 1,000 USD
월 합계: 2,250.04 USD
ID
예: 보안 고객 지원 액세스 관리
지원 대화를 위한 Slack, 통화 기록을 가져오는 Zoom, 문제 추적 및 커밋 로그를 위한 GitHub 등 다양한 도구에 액세스하여 기술 팀을 지원하는 고객 지원 에이전트를 운영할 계획입니다. 구현에서는 사용자 또는 지원 엔지니어를 “대신하여” 안전하고 위임된 액세스를 위해 AgentCore Identity를 사용합니다. 이 시스템은 기존 자격 증명 공급자(예: Okta, Microsoft Entra ID, Amazon Cognito)와 호환되며 OAuth 토큰부터 IAM 역할까지 모든 인증 방법을 관리하므로 사용자 지정 보안 인프라가 필요하지 않습니다.
1만 명의 월간 활성 사용자가 에이전트를 사용하고 있으며, 각각 평균 5건의 상호 작용을 하고, 각 사용자마다 매월 세션당 도구 액세스 3회가 필요하다고 가정해 보겠습니다. 이때, 월 비용은 다음과 같이 분석됩니다.
요청된 총 토큰 수: 사용자 1만 명 × 세션 5개 × 도구 3개 = 15만 토큰
월 합계: 요청 15만 건 × 0.010 USD/1,000 = 1.50 USD
참고: AgentCore Runtime 또는 Gateway를 사용할 때 AgentCore Identity는 추가 비용 없이 포함됩니다.
메모리
예: 맞춤형 코딩 어시스턴트 에이전트 구현
소프트웨어 엔지니어가 IDE와 터미널에서 코드를 작성, 디버그 및 리팩터링할 수 있도록 지원하는 코딩 어시스턴트 에이전트를 개발할 계획입니다. 개인화된 경험을 제공하려면 에이전트는 세션 중에 컨텍스트를 유지하고 여러 세션에서 사용자 기본 설정을 기억해야 합니다. 구현에서는 AgentCore Memory를 사용하여 에이전트에게 단기 메모리(즉각적인 대화 및 이벤트)과 장기 메모리(세션 전반에 걸친 지속적인 지식)를 모두 제공합니다.
사용자가 에이전트와 상호 작용할 때마다(예: 코드 조각을 보내거나 코딩 질문을 하는 등) AgentCore Memory에 이벤트를 전송하여 단기 메모리로 저장합니다. 장기 메모리의 경우 세션 전반에 걸쳐 디버깅 세션 요약 및 사용자 기본 설정을 자동으로 추출하고 저장하도록 내장된 추출 전략을 구성했습니다. 그러면 에이전트는 이러한 장기 메모리를 검색하여 개발자에게 개인화된 경험을 제공할 수 있습니다.
월 단기 메모리 이벤트 10만 건, 저장된 장기 메모리 만 건, 월 메모리 검색 2만 건을 포함하면 비용은 다음과 같이 분류됩니다.
단기 메모리: 이벤트 10만 건 × 0.25 USD/1,000 = 25 USD
장기 메모리 저장소: 메모리 만 개 × 0.75 USD/1,000 = 7.50 USD
장기 메모리 검색: 검색 2만 건 × 0.50 USD/1,000 = 10 USD
월 합계: 42.50 USD
참고: 사용자 지정 추출 전략을 사용하면 계정의 모델 사용에 대한 추가 요금이 발생할 수 있으므로 장기 보관 비용이 저장된 메모리 1,000개당 0.25 USD로 낮아집니다.
관찰성
AgentCore 관찰성 요금 예시는 여기에서 CloudWatch 요금을 참조하십시오.
오늘 원하는 내용을 찾으셨나요?
페이지의 콘텐츠 품질을 개선할 수 있도록 피드백을 보내주십시오.