- Amazon Bedrock›
- AgentCore›
- 요금
Amazon Bedrock AgentCore 요금
AgentCore를 필요에 맞게 조정하세요. 서비스를 조합하고, 독립적으로 또는 함께 사용하고, AI 이니셔티브가 성장함에 따라 사용한 만큼만 비용을 지불하세요.
사용한 만큼만 비용 지불
Amazon Bedrock AgentCore는 사전 약정이나 최소 수수료 없이 유연한 사용량 기반 요금을 제공합니다. 각 서비스 및 기능(런타임, 게이트웨이, 정책 (프리뷰), ID, 메모리, 관찰성, 평가(프리뷰), 브라우저, 코드 인터프리터 등은 독립적으로 또는 함께 사용할 수 있으며 사용한 만큼만 비용을 지불하면 됩니다. 이러한 모듈식 접근 방식을 사용하면 소규모로 시작하여 에이전트 애플리케이션이 성장함에 따라 규모를 조정할 수 있습니다.
AgentCore를 무료로 시작하십시오. 신규 AWS 고객에게는 최대 200 USD의 프리 티어 크레딧이 제공됩니다. AWS 프리 티어 혜택을 살펴보고 지금 구축을 시작하십시오.
참고: AgentCore 및 AgentCore 평가의 정책은 미리 보기에서 무료로 제공됩니다.
AgentCore 서비스 및 기능
런타임
AgentCore Runtime은 규모를 조정할 수 있는 에이전트 및 도구를 배포하고 확장하기 위해 특별히 설계된 안전한 서버리스 런타임입니다. 빠른 반복을 위한 직접 코드 배포와 최대 제어를 위한 컨테이너 기반 배포 중에서 선택하세요.
사용한 활성 리소스에 대해서만 비용을 지불
사전 할당된 리소스(즉, 에이전트를 호스팅하는 동안 고정된 인스턴스 크기 및 초당 비용) 에 대해 요금을 부과하는 기존 컴퓨팅 서비스와 달리 AgentCore Runtime에서는 활성 리소스 소비에 대해서만 비용을 지불합니다. 이를 통해 일반적으로 30~70%의 시간을 I/O 대기(LLM 응답, 도구/API 호출 또는 데이터베이스 쿼리 대기)에 소비하는 에이전트 워크로드의 비용을 크게 절감할 수 있습니다. 사전 할당된 요금을 사용하면 이러한 대기 기간 동안 유휴 CPU 비용을 지불하게 됩니다. AgentCore Runtime의 활성 리소스 사용량 기반 요금제를 사용하면 다른 백그라운드 프로세스를 실행하지 않아도 I/O 대기 및 유휴 시간이 무료입니다.
요금은 세션 수명 기간 동안의 CPU 및 메모리 사용량을 기준으로 하며 초당 단위로 계산됩니다. CPU 리소스의 경우 실제 사용량을 기준으로 요금이 부과됩니다. 에이전트가 I/O 대기 중에 CPU를 사용하지 않는 경우 CPU 요금이 부과되지 않습니다. 메모리 리소스의 경우 1초까지 사용한 최대 메모리에 대해 요금이 부과됩니다.
주요 세부 정보:
- 사전 리소스 선택 불필요
- 요금은 실제 CPU 사용량과 해당 초까지 사용된 최대 메모리(최소 1초)를 사용하여 초당 계산됩니다.
- MicroVM 부팅, 초기화, 활성 처리, 유휴 기간부터 세션 종료(MicroVM 종료)까지의 세션 중 실제 리소스 사용량에 대해서만 비용을 지불하면 됩니다.
- 청구에는 애플리케이션의 리소스 사용량 외에 시스템 오버헤드가 포함됩니다.
- 메모리에는 최소 128MB 메모리 요금이 적용
- 스토리지 비용: 컨테이너 배포에는 ECR 스토리지가 필요합니다 (별도 청구). 다이렉트 코드 배포 시 2026년 2월 27일부터 S3 표준 요금으로 배포한 코드 아티팩트의 크기에 대한 요금이 청구됩니다.
- 네트워크 데이터 전송 요금은 표준 EC2 요금으로 적용됩니다.
브라우저
AgentCore Browser는 에이전트가 대규모로 웹사이트와 상호 작용할 수 있도록 빠르고 안전한 클라우드 기반 브라우저 런타임을 제공합니다.
사용한 활성 리소스에 대해서만 비용을 지불
사전 할당된 리소스(즉, 에이전트를 호스팅하는 동안 고정된 인스턴스 크기 및 초당 비용) 에 대해 요금을 부과하는 기존 컴퓨팅 서비스와 달리 AgentCore Browser에서는 활성 리소스 사용량에 대해서만 비용을 지불합니다. 이를 통해 일반적으로 30~70%의 시간을 I/O 대기(LLM 응답, 도구/API 호출 또는 데이터베이스 쿼리 대기)에 소비하는 에이전트 워크로드의 비용을 크게 절감할 수 있습니다. 사전 할당된 요금을 사용하면 이러한 대기 기간 동안 유휴 CPU 비용을 지불하게 됩니다. AgentCore Browser의 활성 리소스 사용량 기반 요금제를 사용하면 다른 백그라운드 프로세스를 실행하지 않아도 I/O 대기 및 유휴 시간이 무료입니다.
요금은 세션 수명 기간 동안의 CPU 및 메모리 사용량을 기준으로 하며 초당 단위로 계산됩니다. CPU 리소스의 경우 실제 사용량을 기준으로 요금이 부과됩니다. 에이전트가 I/O 대기 중에 CPU를 사용하지 않는 경우 CPU 요금이 부과되지 않습니다. 메모리 리소스의 경우 1초까지 사용한 최대 메모리에 대해 요금이 부과됩니다.
주요 세부 정보:
- 사전 리소스 선택 불필요
- 요금은 실제 CPU 사용량과 해당 초까지 사용된 최대 메모리(최소 1초)를 사용하여 초당 계산됩니다.
- MicroVM 부팅, 초기화, 활성 처리, 유휴 기간부터 세션 종료(MicroVM 종료)까지의 세션 중 실제 리소스 사용량에 대해서만 비용을 지불하면 됩니다.
- 청구에는 애플리케이션의 리소스 사용량 외에 시스템 오버헤드가 포함됩니다.
- 메모리에는 최소 128MB 메모리 요금이 적용
- 네트워크 데이터 전송 요금은 표준 EC2 요금으로 적용됩니다.
코드 인터프리터
AgentCore Code Interpreter를 사용하면 에이전트가 샌드박스 환경에서 안전하게 코드를 실행하여 정확도를 높이고 복잡한 엔드투엔드 작업을 해결하는 능력을 확장할 수 있습니다.
사용한 활성 리소스에 대해서만 비용을 지불
사전 할당된 리소스(즉, 에이전트를 호스팅하는 동안 고정된 인스턴스 크기 및 초당 비용)에 대해 요금을 부과하는 기존 컴퓨팅 서비스와 달리 AgentCore Code Interpreter에서는 활성 리소스 사용량에 대해서만 비용을 지불합니다. 이를 통해 일반적으로 30~70%의 시간을 I/O 대기(LLM 응답, 도구/API 호출 또는 데이터베이스 쿼리 대기)에 소비하는 에이전트 워크로드의 비용을 크게 절감할 수 있습니다. 사전 할당된 요금을 사용하면 이러한 대기 기간 동안 유휴 CPU 비용을 지불하게 됩니다. AgentCore Code Interpreter의 활성 리소스 사용량 기반 요금제를 사용하면 다른 백그라운드 프로세스를 실행하지 않아도 I/O 대기 및 유휴 시간이 무료입니다.
요금은 세션 수명 기간 동안의 CPU 및 메모리 사용량을 기준으로 하며 초당 단위로 계산됩니다. CPU 리소스의 경우 실제 사용량을 기준으로 요금이 부과됩니다. 에이전트가 I/O 대기 중에 CPU를 사용하지 않는 경우 CPU 요금이 부과되지 않습니다. 메모리 리소스의 경우 1초까지 사용한 최대 메모리에 대해 요금이 부과됩니다.
주요 세부 정보:
- 사전 리소스 선택 불필요
- 요금은 실제 CPU 사용량과 해당 초까지 사용된 최대 메모리(최소 1초)를 사용하여 초당 계산됩니다.
- MicroVM 부팅, 초기화, 활성 처리, 유휴 기간부터 세션 종료(MicroVM 종료)까지의 세션 중 실제 리소스 사용량에 대해서만 비용을 지불하면 됩니다.
- 청구에는 애플리케이션의 리소스 사용량 외에 시스템 오버헤드가 포함됩니다.
- 메모리에는 최소 128MB 메모리 요금이 적용
- 네트워크 데이터 전송 요금은 표준 EC2 요금으로 적용됩니다.
게이트웨이
Amazon Bedrock AgentCore Gateway를 사용하면 API와 Lambda 함수를 에이전트 호환 도구로 변환하고 기존 MCP 서버에 연결하여 에이전트가 도구에 안전하게 액세스할 수 있습니다.
사용량 기반 요금
에이전트가 Gateway를 통해 거는 API 직접 호출에 대해서만 비용을 지불하면 됩니다. MCP 작업(예: ListTools, CallTool, Ping), 검색 쿼리, 시맨틱 검색 기능을 위해 인덱싱된 도구의 수를 기준으로 요금이 부과됩니다.
주요 세부 정보:
- 선결제 비용이나 최소 약정 불필요
- 네트워크 데이터 전송 요금은 표준 EC2 요금으로 적용됩니다.
정책(미리 보기)
Amazon Bedrock AgentCore의 정책을 사용하면 에이전트가 취하는 작업을 포괄적으로 제어할 수 있으므로 에이전트가 속도 저하 없이 정의된 범위 내에서 업무를 수행할 수 있습니다.
사용량 기반 요금
에이전트 실행 중에 수행한 승인 요청에 대해서만 비용을 지불하면 됩니다. 에이전트가 AgentCore Gateway를 통해 도구를 호출할 때마다 Policy는 해당 작업을 규칙과 비교하여 허용 또는 거부 여부를 결정합니다.
또한 Policy는 자연어 정책 작성 기능을 제공하므로 간단한 자연어 설명을 사용하여 Cedar 정책을 만들 수 있습니다. 자연어를 Cedar 정책 설명으로 변환할 때 처리된 사용자 입력 토큰 1,000개당 요금이 부과됩니다.
자격 증명
AgentCore Identity는 에이전트 ID 및 액세스 관리를 간소화하고, 에이전트가 사용자를 대신하여 또는 사전 승인된 사용자 동의를 얻어 스스로 AWS 리소스와 타사 도구 및 서비스에 안전하게 액세스할 수 있도록 합니다.
사용량 기반 요금
AgentCore Runtime 또는 AgentCore Gateway를 통해 AgentCore Identity를 사용하는 고객에게는 AgentCore Identity 사용에 대한 추가 요금이 발생하지 않습니다. 다른 모든 시나리오의 경우 사용한 만큼만 비용을 지불하며, 에이전트가 OAuth 토큰 또는 API 키에 대해 AgentCore Identity에 요청한 횟수를 기준으로 요금이 부과됩니다.
주요 세부 정보:
- 최소 요금 및 사전 약정 없음
- 결제액은 AWS 이외의 리소스에 대한 승인이 필요한 작업을 수행하기 위해 요청된 성공적인 OAuth 토큰 또는 API 키를 기준으로 계산됩니다.
- 고객이 AgentCore Runtime 또는 AgentCore Gateway를 통해 AgentCore Identity를 사용하는 경우 추가 요금이 발생하지 않습니다.
메모리
AgentCore Memory를 사용하면 복잡한 메모리 인프라 관리가 필요 없어지고, 에이전트가 기억하는 내용을 완벽하게 제어할 수 있어 개발자가 컨텍스트 인식 에이전트를 쉽게 구축할 수 있습니다.
사용량 기반 요금
사용한 만큼만 지불하면 됩니다. 당사의 가격 책정은 간단하고 사용량 기반으로, 에이전트가 가치를 창출하는 방식과 직접적으로 부합합니다.
- 단기 메모리는 생성된 원시 이벤트 수에 따라 가격이 책정되므로 세션 내 컨텍스트에 대한 비용을 예측할 수 있습니다.
- 장기 메모리 레코드는 매월 처리 및 저장된 메모리 수와 메모리 레코드 검색 호출 수를 기준으로 가격이 책정되므로 에이전트가 처리된 지식을 저장하고 사용할 때만 비용을 지불합니다.
- 원시 이벤트에서 장기 메모리를 추출하려면 자동 처리가 포함된 기본 제공 메모리 전략이나 선택한 모델과 프롬프트를 사용하여 계정에서 실행되는 보다 구성 가능한 메모리 전략 중에서 선택할 수 있습니다.
주요 세부 정보:
- 사전 리소스 선택 불필요
- 단기 메모리의 경우 결제 요금은 이벤트 생성 요청별로 계산됩니다.
- 장기 메모리 저장의 경우 청구는 하루에 저장된 메모리 레코드별로 계산되며 한 달 동안 평균화됩니다.
- 장기 메모리 검색의 경우 결제 요금은 검색 메모리 요청별로 계산됩니다.
관찰성
AgentCore Observability는 개발자에게 에이전트 워크플로에 대한 완벽한 가시성을 제공하여 프로덕션 환경에서 에이전트의 성능을 추적, 디버깅, 모니터링할 수 있도록 해줍니다.
사용량 기반 요금
에이전트를 위해 생성, 저장 및 쿼리된 원격 측정에 대해 사용한 만큼만 지불하면 됩니다. 텔레메트리 데이터는 Amazon CloudWatch 계정에 수집되어 저장됩니다. 데이터 수집 및 저장, 정보 검색 및 분석을 위한 쿼리, 로그에 있는 민감한 데이터/개인 식별 정보(PII) 데이터 마스킹에 대한 요금이 부과됩니다. 요금 세부 정보를 검토하려면 Amazon CloudWatch 요금 페이지를 참조하십시오.
평가(미리 보기)
AgentCore Evaluations는 실제 행동을 기반으로 에이전트 품질을 지속적으로 검사하는 데 도움이 됩니다. 팀은 공통 품질 차원에 대해 13개의 내장 평가기를 사용하여 에이전트 평가를 수행하거나 특정 비즈니스 요구 사항에 대한 사용자 지정 평가자를 만들 수 있습니다. 결과는 통합 모니터링을 위해 Amazon CloudWatch에서 제공하는 AgentCore 옵저버빌리티에 통합됩니다.
사용량 기반 가격 책정
사용한 만큼 비용을 지불합니다. 내장 평가기의 경우 평가 중에 처리된 입력 및 출력 토큰을 기준으로 AgentCore에서 가격을 부과합니다. 자체 LLM 인프라를 사용한 맞춤형 평가의 경우 수행한 평가당 비용을 지불하고 사용된 모델에 따라 별도의 추론 비용을 지불합니다.
주요 세부 정보:
- 사전 약정이나 최소 비용이 없음
- 구성 가능한 품질 임계값을 포함한 CI/CD 통합 포함
- 샘플링 규칙 및 대시보드 집계를 통한 생산 모니터링
- 백분율 기반 샘플링, 조건부 샘플링 및 선택적 지표 모니터링을 통한 비용 제어
- 내장 평가기의 경우 모델 사용 비용이 포함됩니다. 별도의 모델 요금은 없습니다.
- 사용자 지정 평가를 수행하면 계정에 추가 모델 사용 요금이 발생합니다.
요금표
|
Service/Capability
|
Type
|
Resource
|
Price
|
|||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
런타임
|
|
|
|
|||||||||
|
브라우저 도구
|
|
|
|
|||||||||
|
코드 인터프리터
|
|
|
|
|||||||||
|
게이트웨이
|
|
|
|
|||||||||
|
ID
|
사용량 기반 |
비 AWS 리소스에 대한 토큰 또는 API 키 요청 |
에이전트가 요청한 토큰 또는 API 키 1,000개당 0.010 USD (참고: AgentCore Runtime 또는 AgentCore Gateway를 통해 고객이 AgentCore Identity를 사용하는 경우 추가 비용 없이 AgentCore Identity가 제공됨) |
|||||||||
|
메모리
|
|
|
|
|||||||||
|
관찰성
|
사용량 기반
|
스팬, 로그 및 메트릭
|
||||||||||
|
평가(미리 보기)
|
|
|
|
|||||||||
|
정책(미리 보기)
|
|
|
|
*기본 제공되는 오버라이드 전략 및 자체 관리 전략의 경우 계정에서 모델 사용에 대한 추가 요금이 발생할 수 있습니다.
요금 예
런타임
예: 고객 지원 에이전트 배포
채팅과 이메일에서 사용자 문의를 해결하는 고객 지원 에이전트를 배치할 계획입니다. 에이전트는 주문 문제, 계정 확인 및 정책 설명을 처리합니다. RAG(검색 증강 생성)를 사용하여 제품 정책을 가져오고 MCP(모델 컨텍스트 프로토콜) 호환 도구를 사용하여 주문 상태를 쿼리하고 지원 티켓을 업데이트합니다. 각 에이전트 세션에는 벡터 저장소에 대한 RAG 호출 1회, MCP 도구 호출 2회(예: OrderAPI, TicketAPI) 및 2개의 LLM 추론 단계를 포함하는 정교한 다단계 추론이 포함됩니다. 세션을 완전히 분리하고 몇 초 만에 수천 개의 세션으로 확장할 수 있는 유연성이 필요하기 때문에 AgentCore Runtime에 에이전트를 배포했습니다.
매월 1천만 개의 사용자 요청을 처리하고, 각 세션은 70% 의 I/O 대기 시간(LLM 응답 및 API 호출 대기)으로 60초 동안 실행되며, I/O 중에는 다른 백그라운드 프로세스가 실행되지 않습니다. 각 에이전트 세션은 활성 처리 중에 1vCPU를 사용합니다. 메모리 사용량은 초기화 시 1GB에서 시작하여 RAG 처리 중에 2GB로 증가하며, 나머지 세션 동안 복잡한 도구 호출 중에는 2.5GB에서 최고조에 달합니다. 월 비용은 다음과 같이 분석됩니다.
세션당 CPU 비용: 18초(활성 처리 시간만 해당)×1vCPU×(0.0895/3600 USD)=0.0004475 USD
세션당 메모리 비용: 10초×1GB×(0.00945/3600 USD)+20초×2GB×(0.00945/3600 USD)+30초×2.5GB×(0.00945/3600 USD)=0.000026 USD+0.000053 USD+0.000197 USD=0.000276 USD
세션당 총 비용: 0.0007235 USD
월간 총액: 1천만 세션 × 0.0007235 USD= 7,235 USD
스토리지 비용: 컨테이너 기반 배포에서는 게시된 ECR 요금에 따라 ECR 스토리지를 별도로 관리합니다. 대신 직접 코드 배포를 사용한 경우 코드 아티팩트에 S3 표준 요금(2026년 2월 27일부터 시작)이 적용됩니다. 100MB 에이전트의 경우 이 요금으로 인해 월 최대 0.0023 USD의 스토리지 비용이 발생합니다.
사전 할당된 요금과 비교: 이 워크로드가 사전 할당된 리소스에 대해 요금을 청구하는 서비스에서 실행된 경우 전체 60초 동안 최대 사용량(2.5GB 메모리, 1vCPU)을 프로비저닝해야 하므로 CPU 비용은 최대 3.3배 증가하고 메모리 비용은 최대 1.4배 더 높아집니다. 위의 예에서 CPU 사용량이 전체 워크로드 비용의 62% 를 차지한다는 점을 고려하면 CPU 비용 절감 효과가 상당합니다. AgentCore Runtime의 사용량 기반 가격 책정은 ‘I/O 대기 시간 무료’의 이점을 자동으로 캡처하고 확장 시 실제 메모리 사용량에 대해서만 요금을 청구하므로 기존 컴퓨팅 옵션에 비해 상당한 비용 효율성을 제공합니다.
브라우저
예: 자동 여행 예약 시스템
웹 상호 작용을 통해 전체 여행 계획 및 예약을 자동화하는 여행 예약 에이전트를 만들 계획입니다. 구현하려면 항공편, 호텔 검색, 클릭 시뮬레이션, 가격 추출, 예약 양식 제출을 위한 헤드리스 브라우저를 동적으로 관리할 수 있는 AgentCore Browser의 안전한 서버리스 런타임이 필요합니다. AgentCore Browser 도구는 세션 격리 샌드박스 컴퓨팅과 라이브 뷰 및 세션 재생을 통한 포괄적인 관찰성을 비롯한 엔터프라이즈급 기능을 제공합니다.
에이전트는 매월 10만 건의 요청을 처리합니다. 각 브라우저 세션은 10분 동안 실행되며 I/O 대기 시간은 80% 입니다. 액티브 프로세싱 중에는 2vCPU와 4GB 메모리를 지속적으로 사용하고 I/O 중에는 0.4vCPU와 5GB 메모리를 사용합니다. 월 비용은 다음과 같이 분석됩니다.
세션당 CPU 비용: 120초(80% I/O 대기 시간으로 조정) × 2 vCPU × (0.0895 USD/3600) = 0.005967 USD
세션당 메모리 비용: 600초 × 4GB × (0.00945 USD/3600) = 0.0063 USD
세션당 총 비용: 0.012267 USD
월간 총액: 10만 세션 × 0.012267 USD = 1,226.67 USD
코드 인터프리터
예: 자연어 데이터 분석 자동화
데이터세트 쿼리, 시각화 및 통계 분석을 모두 자연어로 처리하여 비즈니스 및 제품 팀을 지원하는 데이터 분석가 에이전트를 배포할 계획입니다. 에이전트는 사이트 트래픽과 전환율 간의 상관관계 분석과 같은 복잡한 요청에 대해 Python 코드를 동적으로 생성하고 실행합니다. AgentCore Code Interpreter는 엔터프라이즈 보안 정책을 준수하는 격리된 샌드박스 환경, 다국어(JavaScript, TypeScript, Python)를 위한 사전 빌드된 실행 런타임, 대용량 파일 지원 등을 제공하므로 잘 활용할 수 있습니다.
에이전트는 요청당 코드 실행 3회로 매월 10,000건의 요청을 처리합니다. 각 실행은 2분 동안 진행되며 I/O 대기 시간은 60%이며, 활성 처리 중에는 2vCPU를 사용하고 4GB 메모리를 지속적으로 사용합니다. 월 비용은 다음과 같이 분석됩니다.
세션당 CPU 비용: 48초(I/O 대기 60%로 조정) × 2 vCPU × (0.0895 USD/3600) = 0.002387 USD
세션당 메모리 비용: 120초 × 4GB × (0.00945 USD/3600) = 0.00126 USD
세션당 총 비용: 0.003647 USD
월간 총액: 3만 건의 실행 건수 × 0.003647 USD = 109.40 USD
게이트웨이
예: HR 어시스턴트 에이전트를 내부 도구에 연결
내부 정책 질문, 휴가 잔여일, 복리후생 등록 및 급여 문의를 처리하는 중견기업을 위한 HR 어시스턴트 에이전트를 구축할 계획입니다. 사용자 요청을 처리하려면 에이전트가 여러 내부 시스템(온보딩, 복리후생, 급여 및 휴가 관리 API)을 도구로 액세스해야 합니다. AgentCore Gateway를 사용하여 200개의 내부 도구를 위한 MCP 서버를 생성했습니다. 이 MCP 서버는 에이전트가 코드를 작성하지 않고도 어디서든 상호 작용할 수 있습니다. 도구 사용의 정확도를 높이기 위해 검색 기능을 활용하여 도구 메타데이터를 인덱싱하고 상호 작용 컨텍스트를 기반으로 에이전트를 호출하는 동안 도구의 동적 매칭을 활성화했습니다.
각 에이전트 상호 작용에는 검색 API 1개와 InvokeTool API 간접 호출 4건이 필요합니다. 매월 5천만 건의 상호 작용으로 5천만 건의 검색과 2억 건의 InvokeTool 호출이 발생합니다. 월 비용은 다음과 같이 분석됩니다.
SearchToolIndex 요금: 도구 200개 × 도구 100개당 0.02 USD = 0.04 USD
검색 API 요금: 5천만 ×2,500만 USD = 1,250 USD
InvokeTool API 요금: 2억 × 500만 USD = 1,000 USD
월 합계: 2,250.04 USD
정책(미리 보기)
예:
운영 팀이 공급업체 선택, 구매 주문 생성 및 송장 승인을 관리하는 데 도움이 되는 조달 자동화 에이전트를 개발할 계획입니다. 작업이 정의된 비즈니스 규칙을 따르도록 하려면 AgentCore Gateway 도구와 함께 Policy를 사용하여 정의된 정책에 대해 실행하기 전에 모든 작업을 자동으로 확인합니다. 에이전트가 작업(예: 구매 승인 전송 또는 결제 시작)을 시도할 때마다 게이트웨이는 도구 호출을 가로채어 작업의 허용 또는 거부 여부를 확인합니다. 에이전트가 한 달에 10만 개의 세션을 처리하고 각 세션에서 평균 5회의 도구 호출을 수행한다고 가정해 보겠습니다. 각 도구 호출에 대해 하나의 승인 요청을 구현하는 경우 다음과 같이 비용을 세분화하여 매월 50만 건의 권한 부여를 요청하게 됩니다.
승인 요청=세션 10만 개x도구 호출 5회/세션x정책 1개 적용/도구 호출=50만 승인 요청
월별 총액: 요청 50만 개x0.000025=12.50 USD
배포 전에 팀은 선택적으로 자연어 정책 작성을 사용하여 온보딩 및 정책 설정을 간소화합니다. Cedar 정책을 수동으로 작성하는 대신 일반 언어로 규칙을 설명하고 AgentCore에서 규칙을 Cedar 정책 설명으로 변환합니다. 이 작성 단계에서 처리된 사용자 입력 토큰 수를 기준으로 일회성 요금이 부과됩니다. 팀에서 10,000개의 토큰을 사용하여 여러 정책을 작성한 경우 비용은 다음과 같습니다.
정책 작성=토큰 2만 개×입력 토큰 1개당 0.13달러=2.60 USD
참고: 관찰성이 활성화된 경우 표준 CloudWatch 요금이 적용됩니다.
ID
예: 보안 고객 지원 액세스 관리
지원 대화를 위한 Slack, 통화 기록을 가져오는 Zoom, 문제 추적 및 커밋 로그를 위한 GitHub 등 다양한 도구에 액세스하여 기술 팀을 지원하는 고객 지원 에이전트를 운영할 계획입니다. 구현에서는 사용자 또는 지원 엔지니어의 안전하고 위임된 액세스를 위해 AgentCore Identity를 사용합니다. 이 시스템은 기존 자격 증명 공급자(예: Amazon Cognito, Okta, Microsoft Entra ID)와 호환되며 OAuth 토큰에서 API 키까지 모든 인증 방법을 관리하므로 사용자 지정 보안 인프라가 필요 없습니다.
1만 명의 월간 활성 사용자가 에이전트를 사용하고 있으며, 각각 평균 5건의 상호 작용을 하고, 각 사용자마다 매월 세션당 도구 액세스 3회가 필요하다고 가정해 보겠습니다. 이때, 월 비용은 다음과 같이 분석됩니다.
요청된 총 토큰 수: 사용자 1만 명×세션 5개×도구 3개=15만 토큰
월 합계: 요청 15만 건 × 0.010 USD/1,000 = 1.50 USD
참고: AgentCore Runtime 또는 Gateway를 사용할 때 AgentCore Identity는 추가 비용 없이 포함됩니다.
메모리
예: 맞춤형 코딩 어시스턴트 에이전트 구현
소프트웨어 엔지니어가 IDE와 터미널에서 코드를 작성, 디버그 및 리팩터링할 수 있도록 지원하는 코딩 어시스턴트 에이전트를 개발할 계획입니다. 개인화된 경험을 제공하려면 에이전트는 세션 중에 컨텍스트를 유지하고 여러 세션에서 사용자 기본 설정을 기억해야 합니다. 구현에서는 AgentCore Memory를 사용하여 에이전트에게 단기 메모리(즉각적인 대화 및 이벤트)과 장기 메모리(세션 전반에 걸친 지속적인 지식)를 모두 제공합니다.
사용자가 에이전트와 상호 작용할 때마다(예: 코드 조각을 보내거나 코딩 질문을 하는 등) AgentCore Memory에 이벤트를 전송하여 단기 메모리로 저장합니다. 장기 메모리의 경우 세션 전반에 걸쳐 디버깅 세션 요약 및 사용자 기본 설정을 자동으로 추출하고 저장하도록 내장된 추출 전략을 구성했습니다. 그러면 에이전트는 이러한 장기 메모리를 검색하여 개발자에게 개인화된 경험을 제공할 수 있습니다.
월간 단기 기억 이벤트 10만 건, 저장된 장기 기억 기록 10,000건, 월간 기억 기록 검색 호출 20,000건을 기준으로 비용은 다음과 같이 분류됩니다.
단기 메모리: 이벤트 10만 건×0.25 USD/1,000=25 USD
장기 메모리 저장소: 메모리 만 개 × 0.75 USD/1,000 = 7.50 USD
장기 메모리 검색: 검색 2만 건×0.50 USD/1,000 =10 USD
월 합계: 42.50 USD
참고: 오버라이드 추출 전략이 내장되어 있으면 장기 보관 비용이 저장된 메모리 1000개당 0.25 USD로 낮아집니다. 단, 계정에서 모델 사용에 대한 추가 요금이 발생할 수 있습니다.
관찰성
예: 다중 에이전트 재무 자문 플랫폼
투자 조사, 포트폴리오 분석 및 규제 준수 검사를 담당하는 여러 전문 에이전트가 포함된 포괄적인 재무 자문 플랫폼을 배포할 계획입니다. 각 에이전트는 데이터베이스 및 웹 검색 쿼리, 금융 데이터 공급자에 대한 API 직접 호출, 문서 분석을 통해 복잡한 다단계 추론을 수행합니다. 플랫폼은 수백만 건의 트랜잭션을 처리하고 모든 상담원 상호 작용에 대한 추적, 지표 및 로그를 포함한 광범위한 원격 측정 데이터를 생성합니다. AgentCore Observability를 사용하여 포괄적인 감사 추적을 통해 성능을 모니터링하고, 문제를 디버그하고, 재무 규정을 준수할 수 있습니다.
플랫폼은 상담원 상호작용, API 호출, 시스템 이벤트를 통해 매월 10TB의 관찰성 데이터를 생성합니다. 전체 범위의 30% 가 이벤트 로그(모델 호출, 도구 호출)라고 가정하면 약 6TB(스팬 이벤트당 로그 데이터 2KB로 가정)가 CloudWatch 표준 로그에 기록됩니다. 월 비용은 다음과 같이 분석됩니다.
월간 스팬 인제스트 요금: 10TB×1,000GB/TB×0.35 USD/GB=3,500 USD
월별 이벤트 로깅 요금: 6TB×1,000GB/TB×0.50달러/GB=3,000 USD
월간 총액: 3,500 USD+3,000 USD=6,500 USD
* CloudWatch로 전송되는 모든 지표 및 비 텔레메트리(표준) 로그 데이터에는 표준 CloudWatch 요금이 적용됩니다.
평가(미리 보기)
예: 전자 상거래 고객 서비스 상담원 품질 모니터링
전자 상거래 플랫폼에 대한 주문 문의, 반품 처리 및 제품 추천을 처리하는 고객 서비스 에이전트를 배치할 계획입니다. 일관된 서비스 품질을 보장하기 위해 AgentCore 평가를 사용하여 개발 및 프로덕션 환경 전반에서 에이전트 성능을 모니터링합니다. 구현에는 3개의 내장 추적 수준 평가자 (정확성, 유용성, 목표 성공률) 와 비즈니스별 품질 지표에 대한 사용자 지정 평가자 1개가 사용됩니다.
개발 과정에서 CI/CD 파이프라인은 매월 5,000개의 테스트 상호 작용을 평가합니다. 프로덕션 환경에서는 매월 10,000건의 고객 대화를 평가하는 샘플링 규칙을 통해 실시간 상호 작용의 2% 를 모니터링합니다. 내장된 각 평가는 평균 15,000개의 입력 토큰(대화 내역, 제품 카탈로그 및 주문 세부 정보 포함)을 처리하고 점수를 매길 수 있는 300개의 출력 토큰을 생성합니다.
월 비용은 다음과 같이 분석됩니다.
내장 평가기:
- 총 상호작용 평가: 15,000개(개발 5,000개+생산 10,000개)
- 상호작용당 내장 평가자 수: 3(정확성, 유용성, 목표 성공률)
- 전체 평가: 상호작용 15,000건×평가자 3명=평가 45,000건
- 입력 토큰: 평가 45,000개×토큰 15,000개=675만 토큰
- 출력 토큰: 평가 45,000개×토큰 300개=1,350만 토큰
- 입력 비용: 675만 토큰×2.40 USD/1백만 USD=1,620 USD
- 출력 비용: 1,350만 토큰×12.00 USD/1백만 USD=162 USD
- 내장 평가기 소계: 1,782 USD
맞춤형 평가:
- 총 사용자 지정 평가: 상호작용 15,000개×사용자 지정 평가자 1명=평가 15,000개
- 맞춤형 평가 비용: 평가 15,000건×1.50 USD/1,000 USD= 22.50 USD
월 합계: 1,804.50 USD
참고: 내장 평가기의 경우 모델 사용 비용이 포함됩니다. 사용자 지정 평가 시 계정에 추가 모델 사용 요금이 발생합니다.
I want to
start building with AgentCore
오늘 원하는 내용을 찾으셨나요?
페이지의 콘텐츠 품질을 개선할 수 있도록 피드백을 보내주십시오.