AWS 기술 블로그

Category: Amazon Machine Learning

프롬프트 인젝션 방어: AgentCore 기반 다층 보안 설계 패턴

들어가며 LLM 기반 에이전트를 프로덕션으로 옮기는 순간, 모든 팀이 한 번쯤 마주치는 질문이 있습니다. “에이전트가 다른 사용자의 데이터를 노출하지 않는다는 걸 어떻게 보장할 수 있나요?” 주문 내역, 의료 기록, 사내 문서, 금융 거래 – 도메인이 무엇이든 질문의 본질은 같습니다. 이 문제를 해결하기 위해 많은 팀이 처음에는 시스템 프롬프트로 해결하려고 합니다. 보안 규칙: – 사용자에게 내부 […]

Sim-to-Real과 Real-to-Sim: 유능한 Physical AI를 가능하게 하는 핵심 엔진

이 글은 AWS Blog의 Sim-to-Real and Real-to-Sim: The Engine Behind Capable Physical AI by Dario Macagnano, Ignacio Sánchez, and Quinn Cheong 게시글을 번역한 글 입니다. 서론 Physical AI 시스템, 즉 현실 세계를 인지하고 추론하며 행동하는 로봇은 빠르게 발전하고 있습니다. Sim-to-Real 파이프라인은 이러한 발전의 핵심에 있습니다. 그러나 연구실 밖에서도 안정적으로 작동하는 모델을 만드는 것은 이 분야에서 […]

신한카드, 온톨로지와 소형언어모델로 고효율 AI 챗봇 구축하기

들어가며: 금융 고객 상담의 새로운 패러다임 신한카드는 대한민국 대표 신용카드사로, 수백만 고객에게 종합 금융 서비스를 제공하고 있습니다. 신한카드는 고객 서비스 품질 향상을 위해 AI 챗봇 레이(Ray)를 지속적으로 발전시켜 왔습니다. 이를 기반으로 보다 진화된 차세대 AI 챗봇을 기획하였고, AWS Generative AI Innovation Center (AWS GenAIIC)와의 협력을 통해 그 토대를 마련하게 되었습니다. 차세대 AI 챗봇이 풀어야 할 […]

이커머스 부정 반품 요청, AI로 차단한다: Amazon Nova Fine-tuning으로 산업 특화 가드레일 구성하기

요약: 패션 이커머스에서 급증하는 부정 반품 요청을 사전에 차단하기 위해 Amazon Nova 2 Lite 모델을 미세 조정(Fine-tuning)하여 도메인 특화 Custom Guardrail을 구축한 사례를 소개합니다. Fine-tuning을 통해 부정 의도 탐지 정확도를 73.0%에서 94.6%로 21.6%p 향상시켰으며, 비용 효율적인 소형 모델로도 우수한 성능을 달성했습니다. 서론: 패션 이커머스가 직면한 반품 부정 행위 문제 패션 이커머스 업계는 다른 소매업에 비해 […]

GloZ의 Amazon OpenSearch Service를 기반으로 한 자연어 이력서 검색 시스템 구축 사례 — Part 2: 하이브리드 검색과 자연어 쿼리 변환

1. Part 1 요약 Part 1: 데이터 파이프라인과 인덱싱에서는 검색 정확도의 기반이 되는 데이터 파이프라인을 다루었습니다. 글로지(GloZ Inc.)는 약 10만 명의 번역가 이력서를 검색 가능한 형태로 구조화하기 위해, 문서 유형별 파싱 → LLM 기반 메타데이터 추출 → 동의어·표기 변형 정규화 → 환각 검증 → 임베딩 입력 전략 최적화로 이어지는 데이터 정제 파이프라인을 구축했습니다. Amazon OpenSearch […]

RIMAN KOREA의 Amazon Bedrock Knowledge Bases를 활용한 자연어 기반 상품 검색 시스템 구축기

RIMAN KOREA 소개 RIMAN KOREA는 2018년 설립된 K-뷰티 글로벌 다이렉트 셀링 기업입니다. 자이언트 병풀, 제주 용암해수 등 독자 원료를 기반으로 고기능성 스킨케어(ICD), 비건 뷰티(보타랩), 건강기능식품(라이프닝)을 주력 제품으로 합니다. 리만코리아의 E-Commerce 팀은 운영 중인 온라인 자사몰(이하 리만몰)을 고도화하기 위해 사용자로부터 접수된 문의 내역을 분석하였습니다. 그 결과 상품 검색이 어렵다는 문제를 발견하였습니다. 기존 시스템은 상품명 기반의 키워드 […]

Strands와 AgentCore를 활용해 Amazon RDS for SQL Server용 에이전틱 AI 구축하기

이 글은 AWS Database Blog의 “Building agentic AI for Amazon RDS for SQL Server with Strands and AgentCore” by Sudhir Amin 게시글을 번역한 글입니다. Amazon Relational Database Service (Amazon RDS) for SQL Server 인스턴스를 관리한다면, 수년에 걸쳐 진단 스크립트들을 축적했을 것입니다. 이 스크립트들은 blocking 세션을 조회하고, 느린 프로시저를 식별하며, 디스크 공간을 모니터링하고, 인덱스 사용량을 분석합니다. […]

Amazon EC2 G5/G6 인스턴스에서 GPU Tensor Parallelism으로 비용 효과적으로 LLM 서빙하기

최근 많은 기업들이 자체 LLM을 구축하거나, 오픈소스 sLLM(Small Large Language Model)을 활용하여 설치형 LLM서비스를 구성하려는 수요가 크게 증가하고 있습니다. 그런데 실제로 배포하려는 모델을 살펴보면, Llama 3 70B, Qwen 72B, EXAONE 3.5 32B 등 모델을 GPU에 로드할 때 필요한 메모리가 40GB에서 최대 150GB에 달하는 경우가 많아, GPU 메모리가 80GB인 H100/H200이 탑재된 Amazon P5 인스턴스 이상을 요청하는 […]

GraphRAG Toolkit으로 지식 그래프 쿼리하기

시리즈 안내 이 글은 3편으로 기획된 GraphRAG Toolkit 시리즈의 3번째 글입니다. 시리즈의 첫 번째 글인 Neptune GraphRAG Toolkit을 활용하여 정교한 비정형 데이터 검색하기에서는 비정형 데이터에서 벡터 임베딩이 포함된 그래프를 자동으로 구축하고, 구조적으로 관련된 정보를 검색하는 질의응답 전략 프레임워크를 소개했습니다. 두 번째 글인 GraphRAG Toolkit으로 지식 그래프 인덱싱하기에서는 해당 toolkit을 활용하여 지식 그래프를 단계별로 인덱싱하는 과정을 […]

현대오토에버의 Amazon Bedrock으로 구축한 빅데이터 클러스터 장애 대응 자동화 에이전트 구축기

이 글은 현대오토에버의 GenAI Sandbox 활용 생산성 향상 해커톤 시리즈의 세번째 글이며, 현대오토에버의 오명우, 정세종님과 함께 작성하였습니다. 첫 번째 글에서는 현대오토에버와 AWS가 GenAI Sandbox를 활용해 어떻게 생산성 향상 해커톤을 기획하고 운영했는지, 그리고 14개 팀 150여 명이 참여한 이 행사의 전반적인 성과를 소개 했습니다. 두 번째 글에서는 Amazon Bedrock과 LangGraph를 활용해 어떻게 다중 AI 에이전트 기반 […]