AWS 기술 블로그
Category: Generative AI
한국어 Reranker를 활용한 검색 증강 생성(RAG) 성능 올리기
검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 효율적인 데이터 검색과 대규모 언어 모델 (Large Language Model, LLM) 을 결합하여 정확하고 관련성 높은 응답을 생성하는 AI 기술로 부상했습니다. 특히, RAG 방식은 최신 정보를 반영하여 답변의 부정확성이나 환각을 줄인다는 면에서 많은 사용자들의 관심을 받고 있습니다. 그러나 RAG 시스템이 보다 복잡한 실제 애플리케이션에 적용 됨에 따라, 시멘틱 벡터 검색 […]
툰스퀘어의 생성형 AI 모델 배포를 위한 Amazon SageMaker 활용 사례
툰스퀘어 (Toonsquare)는 웹 브라우저 기반의 서비스형 소프트웨어(SaaS) AI 인공지능 웹툰 창작 플랫폼인 ‘투닝(Tooning)’ 서비스를 제공하는 플랫폼입니다. 디지털 창작에 최적화된 핵심 AI 기술을 적용하여 투닝 매직AI, 에디터, 월드 서비스 등을 운영하며 창작 문화를 만들고 혁신을 이뤄내고 있습니다. 특히 투닝 매직 AI를 통해 사용자가 프롬프트를 클릭하거나 직접 입력하여 고해상도의 이미지를 생성할 수 있는 고퀄리티 이미지 창작 서비스를 […]
Amazon Bedrock 기반 Amorepacific 리뷰 요약 서비스 평가 방법 구현하기
Amorepacific은 ‘사람을 아름답게, 세상을 아름답게’ 하는 뷰티 기업으로, 고객의 다양한 아름다움을 존중하며 혁신과 창의성을 통해 글로벌 뷰티 산업을 선도하는 기업입니다. Amorepacific은 설화수, 라네즈, 헤라, 이니스프리, 아이오페, 에뛰드 등 32개의 브랜드를 보유하고 있으며 최근 ‘Live Your New Beauty’ 슬로건 아래, 모든 고객이 자신만의 아름다움을 발견하고 실현하는 삶을 누리는 미래를 만들어나가고자 노력하고 있습니다. Amorepacific의 AI솔루션 팀은 최근 […]
LLM 에 대한 OWASP Top 10을 사용하여 생성형 AI 애플리케이션을 위한 심층적인 방어 보안 설계
이 글은 AWS Machine Learning Blog에 게시된 Architect defense-in-depth security for generative AI applications using the OWASP Top 10 for LLMs을 한국어 번역 및 편집하였습니다. 대규모 언어 모델(LLM)을 기반으로 하여 구축된 생성형 인공 지능(Al) 애플리케이션은 비즈니스 측면에서 경제적 가치를 창출하고 가속화할 수 있다는 잠재력을 입증했습니다. 생성형 AI 기반 애플리케이션의 유형으로는 대화형 검색, 고객 대상 상담원 […]
Amazon Bedrock으로 그래프 RAG 구현하기
개요 대규모 언어 모델들은 방대한 데이터를 기반으로 광범위한 지식과 우수한 문장 생성 능력을 갖추고 있습니다. 그러나 이러한 모델들은 학습 시점 이후의 최신 정보나 특정 주제에 대한 심층 지식을 반영하는 데 한계가 있으며, 때때로 환각(hallucination) 문제로 답변의 정확성을 떨어뜨리기도 합니다. 이러한 문제를 해결하기 위해, RAG(Retrieval Augmented Generation) 프레임워크가 등장했습니다. RAG는 필요한 정보를 자체 데이터베이스에 저장하고 검색해, […]
한영 동시 검색 및 인터넷 검색을 활용하여 RAG를 편리하게 활용하기
기업의 중요한 문서를 검색하여 편리하게 활용하기 위하여 LLM(Large Language Model)을 활용하는 기업들이 늘어나고 있습니다. 기업의 모든 데이터를 사전 학습하는 것은 비용 및 시간에 대한 제약뿐 아니라 데이터 보안 면에서도 바람직하지 않을 수 있습니다. RAG(Retrieval-Augmented Generation)의 지식 저장소(Knowledge Store)를 활용하면, 다수의 문서를 안전하게 검색하여 관련된 문서(Relevant documents)를 추출한 후에 LLM에서 용도에 맞게 활용할 수 있습니다. RAG의 지식 […]
FMOps/LLMOps와 MLOps 차이점 비교 및 생성형 AI 운영하기
이 글은 영문 게시글(FMOps/LLMOps: Operationalize generative AI and differences with MLOps, by Sokratis Kartakis and Heiko Hotz)을 한글 번역, 편집하였습니다. 최근, 많은 고객들께서는 대형 언어 모델(LLM) 에 매우 높은 관심을 보이시고, 생성형 AI가 비즈니스를 어떻게 혁신할 수 있을지에 대해 고민하고 계십니다. 하지만 이러한 솔루션과 모델을 비즈니스 운영에 적용하는 것은 쉬운 일이 아닙니다. 이 블로그에서는 파운데이션 […]
Amazon Bedrock을 이용하여 Stream 방식의 한국어 Chatbot 구현하기
2023년 9월 Amazon Bedrock이 정식버전을 출시하면서 Amazon Titan, Anthropic Claude등의 다양한 LLM (Large Language Model)을 AWS 환경에서 편리하게 사용할 수 있게 되었습니다. 특히 Anthropic의 Claude 모델은 한국어를 비교적 잘 지원하고 있습니다. Chatbot과 원활한 대화를 위해서는 사용자의 질문(Question)에 대한 답변(Answer)을 완전히 얻을 때까지 기다리기 보다는 Stream 형태로 대화하듯이 보여주는 것이 사용성에서 좋습니다. 본 게시글은 Amazon Bedrock을 사용하여 Stream을 지원하는 […]
조카소의 이미지 생성형 AI 기술 및 AWS 서비스를 통한 바디프로필 이미지 생성 서비스 구축
조카소는 AI 기술을 활용하여 고도화된 사용자 경험을 제공하는 서비스입니다. 자막 생성 AI는 복잡한 과정 없이 신속하고 정확한 자동 자막 생성을 가능하게 하는 것으로, 크리에이터에게 콘텐츠 제작의 효율성을 높여줍니다. 바디프로필 AI는 고객의 얼굴 데이터를 활용하여 최적화된 비주얼 아웃풋을 제공, 개인화된 경험을 가능하게 합니다. 코드마피아는 이러한 AI 기반 서비스들을 통해 고객에게 편의성을 제공하고자 합니다. 바디프로필 AI 서비스 […]
VARCO LLM과 Amazon OpenSearch를 이용하여 한국어 Chatbot 만들기
VARCO LLM은 엔씨소프트(NC SOFT)에서 제공하는 대용량 언어 모델(LLM)입니다. VARCO LLM KO-13B-IST는 VARCO LLM KO-13B-FM의 파인 튜닝(Fine Tuning) 모델로서 Question and Answering, Summarization등 다양한 태스크에 활용할 수 있으며, Amazon SageMaker를 이용하여 쉽게 배포하여 사용할 수 있습니다. 또한, 대규모 언어 모델(LLM)은 사전학습(Pre-train)을 통해 많은 경우에 좋은 답변을 할 수 있지만, 학습에 포함되지 않은 특정 영역(domain specific)에 대한 질문에 […]