AWS 기술 블로그

성공적인 게임 출시를 위한 Amazon GameLift Servers 런칭 단계 가이드 – Part2

게임의 인기가 빠르게 확산될 때 처음부터 성공을 위한 준비가 되어 있는 것이 중요합니다. 이 블로그 글은 Amazon GameLift Servers에서 멀티플레이어 게임을 출시할 때 고려해야 할 중요한 영역들을 다룹니다. 게임 출시 2-3개월 전에 필요한 활동들에 중점을 둘 것입니다. 이는 게임의 완전한 공개 출시일 수도 있지만, 오픈 베타, 얼리 액세스 또는 실제 플레이어가 있는 기타 이벤트들을 의미할 수도 […]

성공적인 게임 출시를 위한 Amazon GameLift Servers 사전 제작 단계 가이드 – Part1

멀티플레이어 게임을 개발하고 있다면, 전 세계적으로 게임 서버 플릿을 효율적으로 호스팅하고 확장하며 모니터링하는 방법을 찾고 계실 것입니다. 또한 최고의 플레이어 경험을 위해 플레이어와 가까운 최적의 위치의 게임 서버 플릿에 게임 세션을 효율적으로 배치하는 방법에 대해서도 고민하고 있을 것입니다. 게임 세션을 위해 필요한 인프라를 처음부터 구축하는 것은 부담스러울 수 있습니다. Amazon GameLift Servers는 글로벌 게임 서버 호스팅을 […]

Aurora PostgreSQL에서 한국어 하이브리드 검색 구현하기: pg_bigm + pgvector로 만드는 한국어 특화 RAG

한국어는 교착어 특성상 영어 기반 벡터 검색만으로는 정확한 결과를 얻기 어렵습니다. 이 블로그에서는 Amazon Aurora PostgreSQL에서 pg_bigm(바이그램 키워드 검색)과 pgvector(벡터 시맨틱 검색)를 RRF(Reciprocal Rank Fusion)로 결합한 하이브리드 검색을 구현하여, 한국어 RAG 애플리케이션의 검색 품질을 개선하는 방법을 소개합니다. 왜 한국어에는 하이브리드 검색이 필요한가? RAG(Retrieval-Augmented Generation) 애플리케이션에서 검색 품질은 최종 답변의 정확도를 결정합니다. 벡터 검색(pgvector)은 의미적으로 유사한 […]

딜라이트룸의 ‘Amazon EKS Auto Mode’를 활용한 멀티 클러스터 운영 효율화 사례

딜라이트룸은 글로벌 누적 다운로드 1억 건을 돌파한 수면·기상 솔루션 Alarmy와 B2B 광고 수익화 플랫폼 DARO를 운영하고 있습니다. 최근에는 앱 인수를 통해 사업 영역을 확장하고 있습니다. 2025년 매출 460억 원, 영업이익 200억 원을 기록한 딜라이트룸은 매출 대부분이 해외에서 발생하는 글로벌 중심 기업입니다. Figure 1: 딜라이트룸 소개 앱 인수를 통한 사업 확장은 곧 인프라의 확장을 의미합니다. 새로운 […]

분산 트레이닝 관점에서의 AWS 인터커넥트 기술 소개 – AWS 환경에서 NCCL을 이용한 GPU 간 통신

지난 블로그에서는 ENI(Elastic Network Interface)의 구조와 역할, 그리고 p5.48xlarge와 p6-b300 인스턴스에서 EFA(Elastic Fabric Adapter)를 실제로 어떻게 구성하는지 살펴보았습니다. 이번 블로그에서는 이렇게 구성된 EFA 네트워크 위에서 실제 GPU 간 통신이 어떻게 이루어지는지, 그 핵심에 있는 NCCL(NVIDIA Collective Communications Library) 통신에 대해 소개하고자 합니다. EFA가 고속도로를 깔아주는 인프라라면, NCCL은 그 위에서 수백 대의 GPU가 효율적으로 데이터를 주고받을 […]

Amazon EKS에서 운영하는 자체 관리형 Agentic AI 플랫폼 : 인프라 자동화와 관측성으로 운영 안정성 확보하기

서론 많은 기업이 LLM 기반 에이전틱 워크플로우를 실제 업무에 투입하고 있습니다. 그러나 프로덕션 규모로 확대하면 단일 거대 LLM에 모든 호출을 의존하는 방식의 한계가 드러납니다. 에이전트 내부에서 발생하는 도구 분류·요약·포맷팅 등 매 단계마다 동일한 토큰 과금이 누적되고, 거대 모델의 긴 응답 지연(TTFT)은 실시간 대화에 부적합합니다. 요금 계산이나 약관 검증처럼 정확성이 요구되는 업무에서 환각(hallucination)은 비즈니스 리스크가 되며, […]

Grafana k6로 Amazon EC2 비용 최적화 하기

들어가며 “우리 서비스에 어떤 EC2 인스턴스 타입을 써야 할까?” 클라우드 인프라를 운영하는 엔지니어라면 누구나 한 번쯤 마주치는 질문입니다. Amazon EC2는 700개가 넘는 인스턴스 타입을 제공하며, 각각 CPU 아키텍처와 세대, 메모리/네트워크 구성이 다릅니다. 스펙 시트에 적힌 vCPU 수와 메모리 용량만으로는 실제 워크로드에서의 성능을 예측하기 어렵습니다. 같은 8 vCPU라도 아키텍처(x86 vs ARM), 세대(5세대 vs 8세대), 워크로드 특성에 […]

GraphRAG Toolkit으로 지식 그래프 인덱싱하기

기존의 RAG(Retrieval-Augmented Generation) 방식은 주로 ‘벡터 유사성 검색’에 의존합니다. 하지만 이 방식은 단순히 질문과 언어적으로 유사한 정보만 찾기 때문에, 데이터 간의 복잡한 구조적 관계나 숨겨진 맥락을 놓칠 수 있다는 한계가 있습니다. 지식 그래프(Knowledge Graph)는 이러한 한계를 보완합니다. 데이터를 개체(Entity)와 관계(Relation) 중심으로 연결하여, 질문과 직접적인 단어 유사성이 낮더라도 답변에 꼭 필요한 연관 정보를 정확하게 찾아낼 수 […]

키다리스튜디오의 QA 테스트 케이스 생성 자동화 — Amazon Bedrock과 LangGraph 활용 사례

소개 웹툰/웹소설 플랫폼을 운영하는 키다리스튜디오는 레진코믹스, 봄툰 등 다수의 콘텐츠 플랫폼을 서비스하고 있습니다. 플랫폼의 품질을 보장하기 위해 QA 엔지니어링팀은 매 릴리스마다 수백 개의 테스트 케이스(TC)를 수동으로 작성해왔습니다. 숙련된 QA 엔지니어 한 명이 하나의 페이지에 대한 TC를 작성하는 데 3~4시간이 소요되었고, 이는 빠른 릴리스 주기에 큰 병목이 되고 있었습니다. 키다리스튜디오 AX 개발팀은 이 문제를 해결하기 위해 […]

AWS AI-DLC 기반 라포랩스 사내 배포 플랫폼 Raploy 구축 사례

”비개발 직군도 자기 손으로 배포까지 해내는 환경을 어떻게 만들 수 있을까요?” 라포랩스 AX팀은 AWS AI-DLC(AI-Driven Development Life Cycle) 방법론을 활용하여 사내 배포 플랫폼 Raploy를 구축했습니다. 2026년 2월 말 AWS와 함께 진행한 3일간의 AI-DLC 워크숍에서 Raploy의 뼈대를 만들었고, 이후 약 한 달간의 고도화를 거쳐 2026년 3월 중순 사내 서비스로 오픈했습니다. 이 글에서는 라포랩스가 왜 AI-DLC를 선택했는지, […]