AWS 기술 블로그

AWS의 Claude Platform 소개: AWS 계정을 통한 Anthropic의 네이티브 Claude Platform 시작하기

이 글은 AWS Artificial Intelligence Blog에 게시된 Introducing Claude Platform on AWS: Anthropic’s native platform, through your AWS account 를 한국어로 번역 및 편집하였습니다. 오늘(미국 현지 시간 5월 11일에 공식 GA) 우리는 Claude Platform on AWS의 일반 가용성을 발표하게 되어 기쁩니다. Claude Platform on AWS는 고객이 별도의 자격 증명, 계약 또는 청구 관계 없이 AWS […]

GS SHOP의 영상 기반 AI 상품 추천 플랫폼 구축기

개요 GS SHOP은 대한민국을 대표하는 TV 홈쇼핑 비즈니스에서 출발하여, 이제는 고객의 라이프스타일을 함께 만들어 나가는 온라인 종합 쇼핑 플랫폼으로 자리잡고 있습니다. 기존의 TV 라이브 채널뿐 아니라 데이터 홈쇼핑, 모바일 라이브까지 운영하며 쇼핑 채널을 넓혀왔고, 콘텐츠와 커머스를 결합한 멀티채널 쇼핑 플랫폼으로 진화해 가고 있습니다. 이러한 변화의 흐름 속에서 GS SHOP 검색추천파트는 검색, 광고, 추천 영역 전반에 […]

Agentic AI 기반 플랫폼 – Part3 : AgentCore Policy, Evaluation, Observability로 기업 운영 체계 구축하기

들어가며 이전 글(Part 2)에서는 Amazon Bedrock AgentCore의 Runtime, Gateway, Identity를 활용하여 MCP Registry를 구현하는 방법을 다루었습니다. 다양한 형태의 MCP를 등록하고, AgentCore Gateway를 통해 단일 엔드포인트로 통합하는 아키텍처를 소개했습니다. MCP Registry를 통해 Agent가 Tool을 호출할 수 있는 환경은 갖추었지만, 기업 환경에서 실제 운영하기 위해서는 추가적인 질문에 답해야 합니다. “이 사용자가 이 Tool을 호출할 권한이 있는가?” → […]

AI-DLC 를 팀 프로젝트에 적용하기: Subagent 와 Custom Skill 로 확장한 Armiq 사례

0. 들어가며: 왜 AI-DLC를 적용했는가 AI-DLC(AI-Driven Development Life Cycle)는 요구사항 분석부터 설계, 코드 생성, 리뷰까지 SDLC 전 과정을 AI Agent 기반으로 수행하는 개발 방식입니다. 이번 사례의 파트너인 ARMIQ는 SAP 데이터 영역에서 오랫동안 솔루션을 공급해 온 기업으로, 법인·사업부 분리나 매각 과정에서 발생하는 데이터 분할·이관 이슈, 그리고 데이터 압축·암호화·클라우드 전송 등 데이터 관리와 보안 전반에 특화된 솔루션 […]

Amazon ElastiCache for Valkey의 CESC로 Interactive AI 스토리텔링 플랫폼 최적화하기

인공지능 기술의 발전은 텍스트 기반 게임의 지평을 넓히고 있습니다. 뷰컴즈(Viewcommz)가 운영하는 타닥(Tadak)은 단순한 텍스트 시뮬레이션을 넘어, 사용자가 직접 다양한 세계관을 창조하고 공유하는 ‘멀티버스 형 Interactive AI 스토리텔링 플랫폼’ 입니다. 현재 뷰컴즈는 사용자 경험을 극대화한 차세대 버전의 ‘타닥 v2’를 준비하고 있습니다. 타닥 v2 개발의 핵심 목표는 ‘끊김 없는 몰입(Seamless Immersion)’ 입니다. 타닥의 수많은 세계 안에서 상상력을 […]

성공적인 게임 출시를 위한 Amazon GameLift Servers 런칭 단계 가이드 – Part2

게임의 인기가 빠르게 확산될 때 처음부터 성공을 위한 준비가 되어 있는 것이 중요합니다. 이 블로그 글은 Amazon GameLift Servers에서 멀티플레이어 게임을 출시할 때 고려해야 할 중요한 영역들을 다룹니다. 게임 출시 2-3개월 전에 필요한 활동들에 중점을 둘 것입니다. 이는 게임의 완전한 공개 출시일 수도 있지만, 오픈 베타, 얼리 액세스 또는 실제 플레이어가 있는 기타 이벤트들을 의미할 수도 […]

성공적인 게임 출시를 위한 Amazon GameLift Servers 사전 제작 단계 가이드 – Part1

멀티플레이어 게임을 개발하고 있다면, 전 세계적으로 게임 서버 플릿을 효율적으로 호스팅하고 확장하며 모니터링하는 방법을 찾고 계실 것입니다. 또한 최고의 플레이어 경험을 위해 플레이어와 가까운 최적의 위치의 게임 서버 플릿에 게임 세션을 효율적으로 배치하는 방법에 대해서도 고민하고 있을 것입니다. 게임 세션을 위해 필요한 인프라를 처음부터 구축하는 것은 부담스러울 수 있습니다. Amazon GameLift Servers는 글로벌 게임 서버 호스팅을 […]

Aurora PostgreSQL에서 한국어 하이브리드 검색 구현하기: pg_bigm + pgvector로 만드는 한국어 특화 RAG

한국어는 교착어 특성상 영어 기반 벡터 검색만으로는 정확한 결과를 얻기 어렵습니다. 이 블로그에서는 Amazon Aurora PostgreSQL에서 pg_bigm(바이그램 키워드 검색)과 pgvector(벡터 시맨틱 검색)를 RRF(Reciprocal Rank Fusion)로 결합한 하이브리드 검색을 구현하여, 한국어 RAG 애플리케이션의 검색 품질을 개선하는 방법을 소개합니다. 왜 한국어에는 하이브리드 검색이 필요한가? RAG(Retrieval-Augmented Generation) 애플리케이션에서 검색 품질은 최종 답변의 정확도를 결정합니다. 벡터 검색(pgvector)은 의미적으로 유사한 […]

딜라이트룸의 ‘Amazon EKS Auto Mode’를 활용한 멀티 클러스터 운영 효율화 사례

딜라이트룸은 글로벌 누적 다운로드 1억 건을 돌파한 수면·기상 솔루션 Alarmy와 B2B 광고 수익화 플랫폼 DARO를 운영하고 있습니다. 최근에는 앱 인수를 통해 사업 영역을 확장하고 있습니다. 2025년 매출 460억 원, 영업이익 200억 원을 기록한 딜라이트룸은 매출 대부분이 해외에서 발생하는 글로벌 중심 기업입니다. Figure 1: 딜라이트룸 소개 앱 인수를 통한 사업 확장은 곧 인프라의 확장을 의미합니다. 새로운 […]

분산 트레이닝 관점에서의 AWS 인터커넥트 기술 소개 – AWS 환경에서 NCCL을 이용한 GPU 간 통신

지난 블로그에서는 ENI(Elastic Network Interface)의 구조와 역할, 그리고 p5.48xlarge와 p6-b300 인스턴스에서 EFA(Elastic Fabric Adapter)를 실제로 어떻게 구성하는지 살펴보았습니다. 이번 블로그에서는 이렇게 구성된 EFA 네트워크 위에서 실제 GPU 간 통신이 어떻게 이루어지는지, 그 핵심에 있는 NCCL(NVIDIA Collective Communications Library) 통신에 대해 소개하고자 합니다. EFA가 고속도로를 깔아주는 인프라라면, NCCL은 그 위에서 수백 대의 GPU가 효율적으로 데이터를 주고받을 […]