AWS 기술 블로그

Category: Artificial Intelligence

분산 트레이닝 관점에서의 AWS 인터커넥트 기술 소개 – AWS 환경에서 NCCL을 이용한 GPU 간 통신

지난 블로그에서는 ENI(Elastic Network Interface)의 구조와 역할, 그리고 p5.48xlarge와 p6-b300 인스턴스에서 EFA(Elastic Fabric Adapter)를 실제로 어떻게 구성하는지 살펴보았습니다. 이번 블로그에서는 이렇게 구성된 EFA 네트워크 위에서 실제 GPU 간 통신이 어떻게 이루어지는지, 그 핵심에 있는 NCCL(NVIDIA Collective Communications Library) 통신에 대해 소개하고자 합니다. EFA가 고속도로를 깔아주는 인프라라면, NCCL은 그 위에서 수백 대의 GPU가 효율적으로 데이터를 주고받을 […]

Amazon EKS에서 운영하는 자체 관리형 Agentic AI 플랫폼 : 인프라 자동화와 관측성으로 운영 안정성 확보하기

서론 많은 기업이 LLM 기반 에이전틱 워크플로우를 실제 업무에 투입하고 있습니다. 그러나 프로덕션 규모로 확대하면 단일 거대 LLM에 모든 호출을 의존하는 방식의 한계가 드러납니다. 에이전트 내부에서 발생하는 도구 분류·요약·포맷팅 등 매 단계마다 동일한 토큰 과금이 누적되고, 거대 모델의 긴 응답 지연(TTFT)은 실시간 대화에 부적합합니다. 요금 계산이나 약관 검증처럼 정확성이 요구되는 업무에서 환각(hallucination)은 비즈니스 리스크가 되며, […]

GraphRAG Toolkit으로 지식 그래프 인덱싱하기

기존의 RAG(Retrieval-Augmented Generation) 방식은 주로 ‘벡터 유사성 검색’에 의존합니다. 하지만 이 방식은 단순히 질문과 언어적으로 유사한 정보만 찾기 때문에, 데이터 간의 복잡한 구조적 관계나 숨겨진 맥락을 놓칠 수 있다는 한계가 있습니다. 지식 그래프(Knowledge Graph)는 이러한 한계를 보완합니다. 데이터를 개체(Entity)와 관계(Relation) 중심으로 연결하여, 질문과 직접적인 단어 유사성이 낮더라도 답변에 꼭 필요한 연관 정보를 정확하게 찾아낼 수 […]

키다리스튜디오의 QA 테스트 케이스 생성 자동화 — Amazon Bedrock과 LangGraph 활용 사례

소개 웹툰/웹소설 플랫폼을 운영하는 키다리스튜디오는 레진코믹스, 봄툰 등 다수의 콘텐츠 플랫폼을 서비스하고 있습니다. 플랫폼의 품질을 보장하기 위해 QA 엔지니어링팀은 매 릴리스마다 수백 개의 테스트 케이스(TC)를 수동으로 작성해왔습니다. 숙련된 QA 엔지니어 한 명이 하나의 페이지에 대한 TC를 작성하는 데 3~4시간이 소요되었고, 이는 빠른 릴리스 주기에 큰 병목이 되고 있었습니다. 키다리스튜디오 AX 개발팀은 이 문제를 해결하기 위해 […]

AWS AI-DLC 기반 라포랩스 사내 배포 플랫폼 Raploy 구축 사례

​”비개발 직군도 자기 손으로 배포까지 해내는 환경을 어떻게 만들 수 있을까요?”​ 라포랩스 AX팀은 AWS AI-DLC(AI-Driven Development Life Cycle) 방법론을 활용하여 사내 배포 플랫폼 Raploy를 구축했습니다. 2026년 2월 말 AWS와 함께 진행한 3일간의 AI-DLC 워크숍에서 Raploy의 뼈대를 만들었고, 이후 약 한 달간의 고도화를 거쳐 2026년 3월 중순 사내 서비스로 오픈했습니다.​ 이 글에서는 라포랩스가 왜 AI-DLC를 선택했는지, […]

한국어 파인튜닝된 SPLADE 기반 Neural Sparse 모델과 Amazon OpenSearch 하이브리드 검색 벤치마크

한국어 SPLADE v3 스타일 모델(sewoong/korean-neural-sparse-encoder-base-klue-large)을 Amazon OpenSearch Service에 배포하고, BM25 / Titan Embedding V2 / 각 하이브리드 조합을 MIRACL-ko로 비교했습니다. 코드와 정량 지표 중심으로 Sparse / Dense / Lexical을 어떻게 선택할지 판단할 수 있도록 정리했습니다. 검색의 출발점: TF-IDF와 BM25의 한계 정보 검색(Information Retrieval)은 사용자의 쿼리에 가장 관련성이 높은 문서를 찾아내는 문제입니다. 이 문제에 쓰이는 고전적인 […]

AI Native 제품의 GTM 을 위한 과금 모델 통합 전략

Agentic AI 시대가 본격화되면서 많은 기업들이 AI 에이전트 기반의 혁신적인 제품을 개발하며 공격적으로 투자하고 있습니다. 그러나 기술 개발만큼 중요한 것이 바로 글로벌 Go-To-Market(GTM) 전략입니다. 특히 과금 모델 설계는 제품의 가치를 고객에게 효과적으로 전달하고, 지속 가능한 비즈니스 모델을 구축하는 핵심 요소입니다. 2025년 7월, AWS Marketplace에 AI 에이전트 및 도구 제품 카테고리가 새롭게 도입되었습니다. 현재 3,000개 이상의 […]

에이전틱 AI와 Amazon Bedrock AgentCore를 활용한 전문가 팀 시뮬레이션

이 글은 AWS Spatial Computing Blog에 게시된 Simulating Expert Teams with Agentic AI and Amazon Bedrock AgentCore 를 한국어로 번역 및 편집하였습니다. 소개 여러 전문 분야에 걸친 기술적 질문에 답하는 것은 단순히 정답을 찾는 문제가 아닙니다. 가장 어려운 부분은 그 답을 제공할 수 있는 적절한 사람들을 조율하는 일인 경우가 많습니다. 만약 AI가 전문가 팀을 대체하는 […]

하네스 엔지니어링으로 본 Deep Insight – 로컬 개발에서 프로덕션 운영까지의 설계 여정

AI에게 단순히 “잘 해봐”라고 시키는 것과, AI가 스스로 만들고 평가하고 개선하는 Agentic 시스템을 설계하는 건 완전히 다른 결과물을 만들어냅니다. AWS Korea SA Team은 Agentic AI 시스템을 개발할 때 마주하는 다양한 기술적 챌린지들을 직접 풀기 위해 ‘Deep Insight’, 사용자가 업로드한 CSV 데이터와 분석 질문을 받아 최종 DOCX 리포트를 생성하는 프로덕션 Multi-Agent 시스템을 개발했고, 세 편의 블로그 […]

Eximbay의 AWS Kiro 기반 AX 표준화 여정

생성형 AI를 도입한 조직 대부분이 공통적으로 마주치는 질문이 있습니다. “개인의 생산성 향상이 확인됐는데, 왜 조직 전체의 업무 방식은 달라지지 않는가?” 엑심베이는 이 질문을 AX(AI Transformation)의 출발점으로 삼았습니다. 단순히 AI 도구를 더 많이 사용하는 것이 아니라, 반복 가능한 업무 흐름을 설계하고 그 실행 방식을 조직 자산으로 축적하는 구조를 만드는 것이 목표였습니다. 이 글은 AWS Kiro를 중심축으로 […]