AWS 기술 블로그
Category: Artificial Intelligence
클레온의 AWS Inferentia를 이용한 디지털 휴먼 생성 모델 추론 비용 50% 절감 사례
클레온은 디지털 휴먼을 통한 진정한 소통을 꿈꾸는 스타트업입니다. 지금까지의 소통은 물리적, 시간적, 공간적, 언어적 문제가 있었습니다. 저희는 디지털 휴먼을 활용해 언제 어디서든 쉽고 빠르게 소통할 수 있는 세상을 만들고자 노력합니다. 저희의 서비스는 크게 세 가지 입니다. 1장의 사진과 내 목소리로 디지털 휴먼을 만드는 클론, 다양한 컨셉의 디지털 휴먼과 언제든지 대화하는 챗 아바타, 더빙 언어에 따라 […]
한국어 Reranker를 활용한 검색 증강 생성(RAG) 성능 올리기
검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 효율적인 데이터 검색과 대규모 언어 모델 (Large Language Model, LLM) 을 결합하여 정확하고 관련성 높은 응답을 생성하는 AI 기술로 부상했습니다. 특히, RAG 방식은 최신 정보를 반영하여 답변의 부정확성이나 환각을 줄인다는 면에서 많은 사용자들의 관심을 받고 있습니다. 그러나 RAG 시스템이 보다 복잡한 실제 애플리케이션에 적용 됨에 따라, 시멘틱 벡터 검색 […]
툰스퀘어의 생성형 AI 모델 배포를 위한 Amazon SageMaker 활용 사례
툰스퀘어 (Toonsquare)는 웹 브라우저 기반의 서비스형 소프트웨어(SaaS) AI 인공지능 웹툰 창작 플랫폼인 ‘투닝(Tooning)’ 서비스를 제공하는 플랫폼입니다. 디지털 창작에 최적화된 핵심 AI 기술을 적용하여 투닝 매직AI, 에디터, 월드 서비스 등을 운영하며 창작 문화를 만들고 혁신을 이뤄내고 있습니다. 특히 투닝 매직 AI를 통해 사용자가 프롬프트를 클릭하거나 직접 입력하여 고해상도의 이미지를 생성할 수 있는 고퀄리티 이미지 창작 서비스를 […]
Amazon Bedrock 기반 Amorepacific 리뷰 요약 서비스 평가 방법 구현하기
Amorepacific은 ‘사람을 아름답게, 세상을 아름답게’ 하는 뷰티 기업으로, 고객의 다양한 아름다움을 존중하며 혁신과 창의성을 통해 글로벌 뷰티 산업을 선도하는 기업입니다. Amorepacific은 설화수, 라네즈, 헤라, 이니스프리, 아이오페, 에뛰드 등 32개의 브랜드를 보유하고 있으며 최근 ‘Live Your New Beauty’ 슬로건 아래, 모든 고객이 자신만의 아름다움을 발견하고 실현하는 삶을 누리는 미래를 만들어나가고자 노력하고 있습니다. Amorepacific의 AI솔루션 팀은 최근 […]
생성형 AI를 위한 Amazon SageMaker Endpoint 기반 임베딩 모델 배포
서론 생성형 AI의 기술이 하루가 다르게 발전하고 있으며, 그 접근법 또한 다양해지고 있습니다. 그 중, RAG(Retrieval Augmented Generation, 검색 증강 생성) 접근은 도메인의 문제를 효율적으로 풀기 위한 접근법으로, 생성형 AI의 필수적인 접근 중 하나가 되었습니다. RAG를 활용하는 데에는 여러 방법이 있지만, 가장 널리 사용되는 방법은 임베딩을 사용한 유사도 검색에 기반을 두고 있습니다. 이 접근법은 텍스트를 […]
AWS 개발자 도구를 활용한 사전 코드 보안 점검 파이프라인으로 Shift-Left 구현
이 게시글은 AWS Security Blog에 게시된 “Implement an early feedback loop with AWS developer tools to shift security left by by Barry Conway, Deenadayaalan Thirugnanasambandam, Balamurugan Kumaran, and Nitin Kumar”를 한국어로 번역 및 편집하였습니다. 소프트웨어 개발 사이클(SDLC, Software Development Life Cycle) 내에서, 보안 점검은 일반적으로 코드 개발 및 빌드 이후에 이루어지게 됩니다. 하지만, 이러한 구성은 보안 점검이 완료되지 않은 […]
LLM 에 대한 OWASP Top 10을 사용하여 생성형 AI 애플리케이션을 위한 심층적인 방어 보안 설계
이 글은 AWS Machine Learning Blog에 게시된 Architect defense-in-depth security for generative AI applications using the OWASP Top 10 for LLMs을 한국어 번역 및 편집하였습니다. 대규모 언어 모델(LLM)을 기반으로 하여 구축된 생성형 인공 지능(Al) 애플리케이션은 비즈니스 측면에서 경제적 가치를 창출하고 가속화할 수 있다는 잠재력을 입증했습니다. 생성형 AI 기반 애플리케이션의 유형으로는 대화형 검색, 고객 대상 상담원 […]
AWS PrivateLink를 사용하여 Amazon Bedrock 프라이빗 접근 설정하기
이 글은 AWS Machine Learning Blog에 게시된 Use AWS PrivateLink to set up private access to Amazon Bedrock By Ram Vittal, Michael Daniels, and Ray Khorsandi를 한국어 번역 및 편집하였습니다. Amazon Bedrock은 AWS에서 제공하는 완전 관리형 서비스로, 개발자에게 여러 파운데이션 모델들과 각 모델들을 사용자의 어플리케이션에 맞게 커스터마이징할 수 있는 도구들을 제공합니다. 이를 통해 개발자는 인프라를 […]
Amazon Bedrock으로 그래프 RAG 구현하기
개요 대규모 언어 모델들은 방대한 데이터를 기반으로 광범위한 지식과 우수한 문장 생성 능력을 갖추고 있습니다. 그러나 이러한 모델들은 학습 시점 이후의 최신 정보나 특정 주제에 대한 심층 지식을 반영하는 데 한계가 있으며, 때때로 환각(hallucination) 문제로 답변의 정확성을 떨어뜨리기도 합니다. 이러한 문제를 해결하기 위해, RAG(Retrieval Augmented Generation) 프레임워크가 등장했습니다. RAG는 필요한 정보를 자체 데이터베이스에 저장하고 검색해, […]
Amazon Bedrock의 Claude와 Amazon Kendra로 향상된 RAG 사용하기
Amazon Bedrock의 Claude LLM v2.1은 200k token을 가지는 Context Window를 제공하고, 환각(Hallucination) 방지에서도 높은 성능을 보여주고 있습니다. 또한, Amazon Q에서는 Amazon Bedrock과 Amazon Kendra을 이용하여 다양한 데이터 소스를 통합하여 업무를 간소화하고, 빠른 의사결정 및 문제점 해결이 가능하도록, 즉각적이고 관련성 있는 정보와 조언을 제공하고 있습니다. 본 게시글은 Amazon Bedrock의 Claude LLM과 Amazon Kendra를 사용하여 RAG (Retrieval Augmented Generation)가 적용된 […]