AWS 기술 블로그
AWS Control Tower 리전 제약 조건에서 Amazon Bedrock 크로스 리전 추론 기능 활용 지침
“이 게시글은 AWS Artificial Intelligence Blogs의 ‘Enable Amazon Bedrock cross-Region inference in multi-account environments by Satveer Khurpa‘ 를 번역 및 편집 하였습니다” Amazon Bedrock의 크로스 리전 추론 기능은 조직이 최적의 성능과 가용성을 유지하면서 AWS 리전 전반에 걸쳐 파운데이션 모델(FM)에 액세스할 수 있는 유연성을 제공합니다. 그러나 일부 기업은 규정 준수 요구사항을 충족하기 위해 서비스 제어 정책(SCP) […]
Amazon EKS에서vLLM Deep Learning Container를 사용하여LLM 배포하기
“이 글은 AWS Architecture Blog에 게시된 ‘Deploy LLMs on Amazon EKS using vLLM Deep Learning Containers by Vishal Naik’ 를 한국어 번역 및 편집하였습니다” 조직들은 대규모 언어 모델(LLM)을 효율적으로 확장 배포할 때 상당한 어려움에 직면합니다. 주요 과제로는 GPU 리소스 활용 최적화, 네트워크 인프라 관리, 모델 가중치에 대한 효율적인 접근 제공 등이 있습니다. 분산 추론 워크로드를 […]
대규모 EC2 환경에서의 운영 전략 : EBS Initialization 자동화 MCP 서버 구현 및 연동
개요 2025년 7월 AWS가 EBS 볼륨 초기화 상태에 대한 가시성을 제공하기 시작하면서, 사용자들은 실제 초기화 진행 상황을 직접 모니터링할 수 있게 되었습니다. Amazon EBS 볼륨 초기화는 스냅샷에서 생성된 볼륨의 모든 블록을 미리 읽어 후속 I/O 작업의 지연을 방지하는 필수 프로세스입니다. 그러나 AWS의 기본 초기화 과정은 예측 불가능한 소요 시간으로 인해 서비스 배포 지연을 야기하며, Amazon […]
SageMaker AI로 해보는 GPT-OSS 추론 성능 테스트와 용량 산정
SageMaker AI 와 LLM 추론 개요 Amazon SageMaker AI는 데이터 과학자와 개발자를 위한 완전 관리형 ML 플랫폼 서비스입니다. 실험부터 배포까지 전체 ML 개발 과정을 단일 환경에서 처리할 수 있습니다. 필수 AI 라이브러리가 미리 설치된 주피터 노트북 포함하여 다양한 IDE를 지원하기 때문에 선호도에 맞는 개발 환경을 선택할 수 있습니다. 개발자들은 복잡한 인프라 관리에 대한 부담 없이 […]
Amazon Bedrock Agent로 30분 만에 여행 예약 에이전트 구축하기 실전 가이드
최근 생성형 AI 트렌드에서 가장 많이 거론되는 키워드는 단연 “에이전트”입니다. RAG (Retrieval-Augmented Generation)가 맞춤형 지식 검색과 응답 생성으로 주목받았다면, 이제는 그 한계를 넘어 사용자의 요청을 이해하고 실제 액션까지 수행하는 AI 에이전트가 새로운 패러다임으로 떠오르고 있습니다. 그렇다면, 단순한 답변만 하는 수준을 넘어 외부 시스템과 연동해 액션까지 수행하는 AI 에이전트는 어떻게 만들 수 있을까요? 이번 포스팅에서는 Amazon […]
자비스앤빌런즈의 Amazon DynamoDB 도입기 – 외부 연계 데이터 저장과 약관 서비스 개선
이 블로그 포스트는 자비스앤빌런즈의 강병규님, 김성신님과 함께 작성되었습니다. 개요 자비스앤빌런즈는 텍스테크 스타트업으로, 세금 신고·환급 도움 서비스 ‘삼쩜삼’을 기반으로 누구나 쉽고 간편하게 세무 도움을 받을 수 있도록 서비스를 제공하고 있습니다. 삼쩜삼은 고객의 세무 정보를 안전하게 확보하고 최적화된 계산을 통해 최대의 환급을 이끌어내며, 현재 누적 가입자 2,400만 명, 누적 환급액 1조 6천억 원을 달성하는 등 꾸준히 신뢰받는 […]
당근의 AWS 기반 피처 플랫폼 구축 여정, Part 2: 피처 수집
해당 포스트는 당근의 김현호님, 서진형님, 권민재님과 함께 작성했으며, 이전에 AWS 글로벌 블로그에 포스팅한 영문 블로그와 동일한 내용입니다. 이 시리즈의 1부에서는 당근이 개발한 새로운 피처 플랫폼에 대해 다루었습니다. 이 플랫폼은 피처 서빙, 스트림 수집 파이프라인, 배치 수집 파이프라인의 세 가지 주요 구성 요소로 이루어져 있습니다. 또한 요구사항, 솔루션 아키텍처, 다단계 캐시를 활용한 피처 서빙에 대해 설명했습니다. […]
당근의 AWS 기반 피처 플랫폼 구축 여정, Part 1: 구축 배경과 피처 서빙
해당 포스트는 당근의 김현호님, 서진형님, 권민재님과 함께 작성했으며, AWS 글로벌 블로그에 포스팅한 영문 블로그와 동일한 내용입니다. 당근은 대한민국을 대표하는 지역생활 커뮤니티로서, 동네에서 가능한 모든 연결에 중심을 둔 서비스입니다. 단순한 중고 거래를 넘어 이웃, 지역 가게, 공공 기관 간의 연결을 강화하고, 따뜻하고 활발한 동네를 만드는 것을 핵심 가치로 삼고 있습니다. 당근은 추천 시스템을 활용해 사용자에게 관심사와 […]
중복된 CIDR 환경에서 효과적인 Egress 트래픽 제어를 위한 아키텍처 설계
1. 개요 본 블로그는 AWS Organizations 환경에서 중복된 VPC CIDR로 인해, 다수의 Transit Gateway 및 인터넷 경로를 구성한 기업들이 직면하는 인터넷 트래픽(Egress) 관리 문제를 해결 하는데 도움을 주고자 작성되었습니다. 기업 인수합병, 레거시 네트워크 통합, 또는 대규모 조직 구조 등으로 인해 불가피 하게 중복 IP 주소 공간을 사용하는 환경에서, 효과적으로 Egress 트래픽을 제어하기 위한 아키텍처 설계 […]
CJ 온스타일 라이브 커머스, Agentic AI로 고객 소통의 새로운 차원을 열다
이 블로그는 CJ온스타일의 고경락, 신영화, 성홍규, 송진호, 기수진 님과 AWS 변상규, 서지혜, Yash Shah, Charlie Chang 님께서 작성 해주셨습니다. 들어가며: 실시간 소통이 만드는 차별화 된 쇼핑 경험 CJ온스타일은 모바일과 TV, 이커머스를 연결해 영상 콘텐츠를 중심으로 한 차별화된 커머스 경험을 제공하는 커머스 플랫폼입니다. 특히 CJ온스타일은 모바일 라이브 커머스 1위(회당 거래액 기준) 플랫폼으로 고객과의 실시간 소통을 통해 차별화된 쇼핑 경험을 제공하는 핵심 […]









