AWS 기술 블로그

Category: Generative AI

Amazon OpenSearch Service의 검색 엔진으로서의 기능 설명

이 글은 AWS Big Data Blog에 게시된 ‘Amazon OpenSearch Service’s vector database capabilities explained‘을 기반으로 한국어로 번역 및 신기능과 관련된 사항을 최신화하였습니다. 개요 OpenSearch는 검색, 분석, 보안 모니터링 및 통합 가시성 애플리케이션을 위한 확장 가능하고 유연하며 확장 가능한 오픈 소스 소프트웨어 제품군으로, Apache 2.0 라이선스에 따라 라이센스가 부여됩니다. 지연 시간이 짧은 검색 및 집계를 제공하는 […]

AWS상에서 비용 효율적으로 영상 컨텐츠 화질 개선하기 – Video Super Resolution(VSR) on AWS

OTT 및 FAST TV 서비스의 증가로 개인화된 콘텐츠, 특히 고전 영화와 TV 프로그램의 수요가 증가하였으며, 이러한 콘텐츠의 대부분은 저해상도(Standard Definition, SD) 형식으로 제공되어 향상된 시청 경험이 필요한 상황입니다. 특히 구작에 대한 수요가 급격히 증가하거나 소위 인기가 역주행하는 경우에 컨텐츠 제공자 입장에서 개선된 화질을 제공하는 것이 콘텐츠를 처음 접하는 잠재 시청자를 확보할 수 있는 중요 요인이 […]

프리킥 챌린지를 위한 생성형 AI 솔루션을 AWS 서비스로 구현하기

이 블로그에서 소개하는 AWS Seoul Summit 2024 “AWS 프리킥 챌린지”에서는 기존의 슈팅 속도 확인 서비스에 더해, 참가자들에게 특별한 경험을 선사하기 위해 생성형 AI 서비스를 도입했습니다. 챌린지 참가자들은 프리킥 슈팅 후 자신의 슬로우 킥 모션을 분석한 영상을 제공받으며, 자신이 유니폼을 착용한 모습으로 합성된 기념 사진을 받을 수 있습니다. 또한, 현장에 직접 참석하지 않더라도 실시간 라이브 중계를 […]

GS SHOP 패션 검색의 진화, Amazon Bedrock 멀티모달 기반 패션 검색 시스템 구현 사례

GS SHOP은 대한민국을 대표하는 홈쇼핑 채널 중 하나입니다. 450만(모바일인덱스 기준)이 넘는 활성 사용자들에게 다양한 상품을 선보이며 편리한 쇼핑 경험을 제공하고 있습니다. GS SHOP에서는 기존에 가격, 사이즈, 브랜드 등의 기준으로 패션 상품을 분류하여 제공해왔습니다. 하지만 최근 색상, 소재, 디자인 등 보다 세분화된 속성으로 상품을 검색할 수 있는 기능을 이커머스 플랫폼들이 도입하면서, GS SHOP 역시 고객들의 니즈에 […]

[그림 1.] Langfuse를 AWS ECS Fargate에 배포한 아키텍처

Amazon ECS와 AWS Fargate를 사용하여 AWS CDK Python으로 Langfuse 호스팅하기

인공지능, 특히 대형 언어 모델(LLM)의 개발 및 배포 분야에서 Langfuse는 혁신적인 플랫폼으로 부상하고 있습니다. Langfuse는 개발팀이 공동으로 LLM 애플리케이션을 디버깅하고, 분석하며, 반복 개선을 할 수 있도록 도와주는 오픈 소스 LLM 엔지니어링 플랫폼입니다. 이 블로그 포스팅에서는 AWS Cloud Development Kit (CDK)를 활용하여 Amazon Elastic Container Registry (ECR) 및 Amazon Elastic Container Service (ECS)와 AWS Fargate를 사용하여 […]

Amazon Bedrock의 파운데이션 모델을 활용한 효과적인 PDF 파싱을 위한 프롬프트 엔지니어링 기법

데이터는 현대 비즈니스의 핵심 자산이며, 기업은 이를 문서, 보고서, 계약서 등 다양한 형태의 정보로 변환하여 보유하고 있습니다. 그리고, 이러한 정보의 상당수는 PDF 와 같은 문서 형식으로 저장되어 있습니다. PDF는 문서 공유와 보전에는 편리하지만, 내부 데이터를 추출하고 가치 있는 인사이트를 도출하기에는 다양한 기술적 접근이 고려되어야 합니다. PDF 파일에서 데이터를 추출할 때, 추출 대상이 스캔 된 이미지인 […]

Task-specialized LLM을 위한 비용 효율적인 서빙 전략: AWS Inferentia2와 Hugging Face Optimum을 활용한 자체 개발 LLM 서빙하기

한때 AI 엔지니어와 많은 연산 자원이 있어야 가능했던 다양한 자연어 처리 작업(task)을 대규모 언어모델(LLM)에 프롬프트 명령 한 줄을 입력하는 것만으로 가능해진 시대가 됐습니다. 텍스트 분류 혹은 QA, 요약, 스타일 변환, 기계번역과 같은 전통적인 자연어 처리 작업들에서 뿐만 아니라 코딩, 수학 문제풀이와 같은 추론 능력이 필요한 작업들에서까지 놀라운 성능을 보이고 있습니다. Claude3 와 GPT4 같은 고성능의 LLM을 […]

생성형 AI로 만드는 나만의 이력서: 웅진 IT의 Amazon Bedrock과 SageMaker 활용 사례

웅진은 디지털 신기술을 활용하여 기업 고객의 디지털 전환을 선도하는 IT기업으로, SAP ERP, 렌탈 솔루션, 모빌리티 솔루션 및 클라우드 서비스를 포함하여 지난 20년 동안 대외 사업을 진행하고 있습니다. 현재 전체 매출의 85%를 대외 사업에서 창출하며, 1,300여개 고객사와 협력하고 있습니다. 고객사의 산업별, 규모별 특성을 고려하여 최적의 고객 맞춤형 IT 솔루션을 제공하고 있습니다. ‘AI 이력서’ 서비스는 웅진이 개발한 […]

한국어 Reranker를 활용한 검색 증강 생성(RAG) 성능 올리기

검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 효율적인 데이터 검색과 대규모 언어 모델 (Large Language Model, LLM) 을 결합하여 정확하고 관련성 높은 응답을 생성하는 AI 기술로 부상했습니다. 특히, RAG 방식은 최신 정보를 반영하여 답변의 부정확성이나 환각을 줄인다는 면에서 많은 사용자들의 관심을 받고 있습니다. 그러나 RAG 시스템이 보다 복잡한 실제 애플리케이션에 적용 됨에 따라, 시멘틱 벡터 검색 […]

툰스퀘어의 생성형 AI 모델 배포를 위한 Amazon SageMaker 활용 사례

툰스퀘어 (Toonsquare)는 웹 브라우저 기반의 서비스형 소프트웨어(SaaS) AI 인공지능 웹툰 창작 플랫폼인 ‘투닝(Tooning)’ 서비스를 제공하는 플랫폼입니다. 디지털 창작에 최적화된 핵심 AI 기술을 적용하여 투닝 매직AI, 에디터, 월드 서비스 등을 운영하며 창작 문화를 만들고 혁신을 이뤄내고 있습니다. 특히 투닝 매직 AI를 통해 사용자가 프롬프트를 클릭하거나 직접 입력하여 고해상도의 이미지를 생성할 수 있는 고퀄리티 이미지 창작 서비스를 […]