AWS 기술 블로그

Category: Technical How-to

Amazon EKS에서vLLM Deep Learning Container를 사용하여LLM 배포하기

“이 글은 AWS Architecture Blog에 게시된 ‘Deploy LLMs on Amazon EKS using vLLM Deep Learning Containers by Vishal Naik’ 를 한국어 번역 및 편집하였습니다” 조직들은 대규모 언어 모델(LLM)을 효율적으로 확장 배포할 때 상당한 어려움에 직면합니다. 주요 과제로는 GPU 리소스 활용 최적화, 네트워크 인프라 관리, 모델 가중치에 대한 효율적인 접근 제공 등이 있습니다. 분산 추론 워크로드를 […]

Amazon S3 Vectors와 Amazon OpenSearch Service로 벡터 검색 최적화하기

본 게시글은 AWS Big Data Blog에 게시된 ‘Optimizing vector search using Amazon S3 Vectors and Amazon OpenSearch Service by Sohaib Katariwala, Bobby Mohammed, Sorabh Hamirwasia, Mark Twomey, and Pallavi Priyadarshini’을 한국어 번역 및 편집하였습니다. 참고: 본 블로그 내용은 7월 15일 기준으로, Amazon S3 Vectors와 Amazon OpenSearch Service의 통합 기능은 프리뷰 버전으로, 변경될 수 있습니다. 벡터 임베딩(Vector Embeddings)과 유사성 검색(Similarity […]

Oracle Database Gateways를 사용하여 Oracle Database를 Aurora MySQL로 마이그레이션하기

많은 기업들이 온프레미스 Oracle Database를 AWS로 마이그레이션하고 있습니다. 이러한 마이그레이션의 주요 동기는 MySQL과 같은 오픈소스 데이터베이스 엔진으로 이동하여 라이선스 비용을 절감하고, 클라우드 네이티브 아키텍처로 현대화하며, 마이크로서비스 아키텍처를 통해 더 유연한 데이터 활용을 가능하게 하는 것입니다. 이 경우, AWS는 Oracle에서 Amazon Aurora MySQL 또는 Amazon Relational Database Service(Amazon RDS) for MySQL로 마이그레이션하기 위해 AWS Database Migration […]

Dedicated Log Volumes를 사용한 Amazon RDS for PostgreSQL의 벤치마크

이 글은 AWS Database Blog에 게시된 “Benchmark Amazon RDS for PostgreSQL with Dedicated Log Volumes”을 한국어 번역 및 편집하였습니다. 오늘날의 데이터 중심 환경에서 조직들은 성능 저하 없이 까다로운 워크로드를 처리할 수 있는 미션 크리티컬 데이터베이스를 확보해야 합니다. Amazon Relational Database Service(Amazon RDS)는 이러한 요구사항을 충족하는 비용 효율적이고 안정적이며 확장성이 뛰어난 관리형 서비스입니다. PostgreSQL에서는 다른 많은 […]

“보이는 데이터”를 “쓸 수 있는 데이터 “로: 코오롱몰의 LLM 기반 상품 속성 추출 여정

들어가며 코오롱몰은 코오롱FnC가 운영하는 프리미엄 패션 이커머스 플랫폼으로서, 자체 브랜드의 헤리티지와 기술 혁신을 결합하여 고객에게 더 나은 쇼핑 경험을 선사하고 있습니다. 특히 AI를 기반으로 기술 중심의 이커머스 플랫폼으로 진화하며, AI 기반 추천, 상품 정보 자동화, 탐색 최적화 등 혁신적인 시도를 통해 고객에게 온라인에서의 새로운 쇼핑 경험을 제공하고 있습니다. 이 글에서는 코오롱몰이 어떻게 LLM 을 활용하여 […]

Amazon GameLift Servers 스팟 인스턴스 잘 활용하기

Amazon GameLift Servers는 세션형 게임 전용 게임 서버 호스팅 서비스로, 멀티플레이어 게임 서버의 배포, 운영, 확장 문제를 손쉽게 해결해줍니다. GameLift Servers는 게임 세션 관리, 플레이어 매칭, 자동 확장 등을 기본적으로 지원하며, 특히 전통적인 온프레미스나 자체 EC2 구축 대비 운영 효율성과 안정성이 크게 향상됩니다. 이로 인해 개발자는 서버 인프라 관리에 신경 쓰지 않고, 게임 로직 개발에 […]

Amazon Bedrock을 활용한 MCP 허브 아키텍처로 기업의 AI 시스템 비즈니스 민첩성 가속화

이 게시글은 AWS Artificial Intelligence Blog의 “Accelerating AI innovation: Scale MCP servers for enterprise workloads with Amazon Bedrock by Xan Huang“ 를 번역 및 편집 하였습니다. 생성형 AI는 새로운 도구, 서비스 및 모델이 자주 출시되면서 빠른 속도로 발전하고 있습니다. Gartner에 따르면, 에이전트 AI는 2025년 주요 기술 트렌드 중 하나이며, 조직들은 기업 환경에서 에이전트를 활용하는 방법에 […]

pgstattuple extension을 사용한 PostgreSQL 성능 향상

이 글은 AWS Database Blog에 게시된 Improve PostgreSQL performance using the pgstattuple extension by Vivek Singh, Kiran Singh, and Sagar Patel 을 한국어 번역 및 편집하였습니다. 기업이 계속해서 방대한 양의 데이터를 생성하고 저장함에 따라 효율적이고 신뢰할 수 있는 데이터베이스 관리 시스템의 필요성이 점점 더 중요해지고 있습니다. 오픈 소스 관계형 데이터베이스 관리 시스템(RDBMS)인 PostgreSQL은 복잡한 데이터 […]

Amazon Q Developer 를 이용한 엑심베이의 JDK 자동화 업그레이드 사례

엑심베이(Eximbay)는 해외결제 시장점유율 1위의 PG(Payment Gateway) 기업으로, 국경 없는 결제 인프라 구축을 목표로 혁신적인 크로스보더 결제 핀테크 서비스를 제공하고 있습니다. 이를 바탕으로 온라인 결제 서비스, 오프라인 결제서비스, 외국인 대상 앱 서비스를 비롯하여 호텔 결제 솔루션을 제공하고 있습니다. 개요 엑심베이의 G-Billing(호텔 결제 솔루션)은 호텔에 특화된 결제 솔루션으로, Oracle PMS(Property Management System)와 결제 단말기를 연동하는 통합 결제 […]

Nexthink가 Amazon Managed Service for Apache Flink를 사용하여 실시간 알림을 구축한 방법

이 게시물은 Nexthink의 Nikos Tragaras와 Raphaël Afanyan이 공동 작성했습니다.  이 글은 AWS Big Data Blog에 게시된  ‘How Nexthink built real-time alerts with Amazon Managed Service for Apache Flink’ 을 한국어 번역 및 편집하였습니다.  이 게시물에서는 Nexthink가 Amazon Managed Service for Apache Flink을 사용하여 새로운 실시간 알림 시스템을 구현한 과정을 설명합니다. 우리는 아키텍처, 주요 기술 선택의 […]