AWS 기술 블로그
AWS AI Day Hackathon 고객 사례 3부: 카카오스타일의 AI 기반 맞춤형 여행 가이드 서비스
지난 11월 진행된 AWS AI Day Hackathon 2024에서 13개 기업들이 선보인 혁신적인 프로젝트들을 시리즈로 소개해 드리고자 합니다.
해커톤 고객 사례 시리즈를 통해 각 기업들이 Amazon Bedrock을 활용해 실제 비즈니스 과제를 어떻게 해결했는지, 기술적 접근 방식과 구현 과정에서의 인사이트를 심층적으로 다뤄보고자 합니다. 본 시리즈가 생성형 AI 도입을 고민하시는 분들께 실질적인 참고 사례가 되길 바랍니다. 해커톤의 전반적인 내용과 주요 성과는 이전 포스팅 “AWS AI Day Hackathon에서 GenAI로 미래를 창조하기“에서 확인하실 수 있습니다.
참가팀 소개
카카오스타일은 스타일 커머스 플랫폼 ‘지그재그‘를 운영하는 이커머스 플랫폼 기업입니다. 최신 기술과 패션, 뷰티, 라이프 트렌드를 결합해 사용자들에게 혁신적이고 개인화된 쇼핑 경험을 제공하고 있습니다. 카카오스타일은 지속적인 기술 혁신을 통해 패션 산업을 선도하는 플랫폼이 되는 것을 목표로 하고 있으며, ‘개인화’와 ‘관계’를 기반으로 이커머스 생태계를 발전시키기 위해 노력하고 있습니다.
프로젝트 배경
코로나 이후 전 세계적으로 여행 인구가 급증하면서, 다양한 국적의 여행객들이 전 세계 곳곳을 방문하고 있습니다. 유명 관광지의 경우 다국어 가이드와 도슨트 서비스가 제공되지만, 잘 알려지지 않은 장소나 비관광지에서는 기본적인 정보조차 얻기 어려운 실정입니다. 이러한 상황에서 여행자들이 직면하는 다양한 문제를 AI 기술을 활용하여 해결하고자 하는 것이 이 프로젝트의 핵심 목표입니다. 구체적으로 다음과 같은 문제를 AI를 통해 해결하여 모든 여행자가 더욱 풍부하고 의미 있는 여행 경험을 할 수 있도록 지원하고자 합니다.
- 언어 장벽: 외국 여행 시 현지 언어를 모르면 관광지에 대한 충분한 정보를 얻기 어렵습니다.
- 알려지지 않은 명소: 유명하지 않은 장소의 경우, 관련 정보를 찾기 어려울 수 있습니다.
- 실시간 정보 접근성: 여행 중 즉석에서 장소에 대한 상세 정보를 얻기 어렵습니다.
- 여행 보험 이해의 어려움: 복잡한 보험 약관을 이해하고 필요한 정보를 추출하는 것이 쉽지 않습니다.
카카오스타일이 제안하는 솔루션 : Oh, My Guide
카카오스타일에서 개발한 ‘Oh, My Guide’는 앞서 언급한 문제들을 해결하기 위해 AWS의 다양한 서비스를 활용한 AI 기반 여행 가이드 애플리케이션입니다. 애플리케이션의 주요 기능은 다음과 같습니다.
1. 이미지 기반 장소 인식
-
- 사용자가 업로드한 사진을 분석하여 장소를 식별합니다.
- Amazon Bedrock과 Google Lens API를 활용합니다.
2. 다국어 정보 제공
-
- 식별된 장소에 대한 정보를 사용자의 언어로 제공합니다.
- Amazon Bedrock의 Claude 모델(Claude 3 Haiku)을 사용하여 위키피디아 등의 정보를 요약하고 번역합니다.
3. 음성 가이드 서비스
-
- Amazon Polly를 사용하여 18개 언어로 음성 가이드를 제공합니다.
4. 주변 정보 및 경로 안내
-
- Google Maps API를 활용하여 주변 음식점, 관광지 정보 및 경로를 제공합니다.
5. 여행 보험 정보 제공
-
- 사용자가 업로드한 보험 약관을 분석하여 질문에 답변합니다.
- Amazon Opensearch와 Amazon Titan Text embeddings 모델(Amazon Titan Text Embeddings V2)을 이용한 RAG(Retrieval-Augmented Generation) 시스템을 구현했습니다.
기술적 접근 방식
1. Amazon Bedrock을 활용한 메인 에이전트
Amazon Bedrock은 애플리케이션의 중심 역할을 합니다. 주요 기능은 다음과 같습니다.
- 사용자와 직접적으로 소통하며 응답하고, tool과 같은 기능을 관리합니다.
프롬프트
- 필요에 따라 Tool을 호출하고 응답을 생성합니다.
2. 장소 인식 및 정보 생성 시나리오
1. 이미지 기반 장소 인식
-
- Google 이미지 검색을 사용하는 Web Scraping 방법으로 사용자가 업로드한 이미지에서 랜드마크를 식별합니다.
- 장소가 식별되어 Google Maps API로 바로 사용 가능한 경우에는 바로 Google Maps API 호출
- 장소가 식별되지 않는 경우에는 이미지로 검색된 문서의 제목들 Amazon Bedrock에게 전달하여 장소 추출 후 텍스트 기반 시나리오 진입
- Google 이미지 검색을 사용하는 Web Scraping 방법으로 사용자가 업로드한 이미지에서 랜드마크를 식별합니다.
2. 텍스트 기반 장소 검색
-
- 사용자가 입력한 장소명을 기반으로 정보를 검색합니다.
- 사용자가 입력한 장소명을 이용하여 위키백과, 익스피디아 등 검색
- 장소명과 관련된 정보가 없을 경우 검색된 상위 5개 웹페이지 문서를 Scraping하여 Amazon Bedrock에게 전달
- 사용자가 입력한 장소명을 기반으로 정보를 검색합니다.
3. 정보 생성
-
- 이미지 혹은 텍스트 기반으로 검색된 정보를 Claude를 통해 요약 및 번역하여 사용자에게 큐레이션 형식으로 제공합니다.
프롬프트
3. 다국어 지원 및 음성 변환
- Amazon Polly를 사용하여 생성된 텍스트 정보를 18개 언어의 음성으로 변환합니다.
- 사용자의 선호 언어로 정보를 번역하여 제공합니다.
4. 주변 정보 및 경로 안내
검색된 장소를 선택하면 현재 위치에서 해당 장소로의 길 안내를 제공합니다.
1. Google Maps API(Places API)를 활용하여:
-
- 주변 음식점, 관광지 등의 정보를 추출합니다.
- 장소명, 주소, 리뷰 요약을 제공합니다.
프롬프트
2. Google Maps API(Directions API)를 활용하여:
-
- 현재 위치에서 추천 장소까지의 상세 경로를 제공합니다.
5. 여행 보험 정보 처리(RAG 구현)
1. PDF 파일 처리
-
- 사용자가 업로드한 여행자 보험 약관 PDF 파일을 Python PyPDF2 라이브러리를 이용하여 불러옵니다.
2. 임베딩 및 검색
-
- Amazon OpenSearch와 Amazon Titan Text embeddings 모델을 사용하여 RAG(Retrieval-Augmented Generation) 시스템을 구현합니다.
- 사용자 질문에 관련된 정보를 효과적으로 검색합니다.
3. 질의 응답
-
- 검색된 정보를 바탕으로 Claude 모델을 사용하여 사용자의 질문에 답변을 생성합니다.
프롬프트
이러한 기술적 구현을 통해 ‘Oh, My Guide’는 사용자에게 실시간으로 맞춤형 여행 정보를 제공하고, 언어 장벽을 극복하며, 복잡한 보험 정보를 쉽게 이해할 수 있도록 돕습니다.
결론
‘Oh, My Guide’는 AI와 클라우드 기술을 결합하여 여행자들에게 실시간, 맞춤형 정보를 제공함으로써 언어 장벽을 극복하고 더욱 풍부한 여행 경험을 제공합니다. 이 과정에서 LLM의 장점인 다국어 번역, 요약 등을 활용하고, Amazon Bedrock을 통해 제공되는 Claude 모델로 RAG, Tool과 같은 다양한 활용 기술을 사용하였습니다. 이 서비스는 단순한 정보 제공을 넘어 여행의 질을 높이고, 여행자들이 새로운 장소를 더욱 깊이 이해하고 즐길 수 있도록 도와줍니다.
나가며
AWS AI Day Hackathon 블로그 시리즈 링크는 아래에서 확인하실 수 있습니다.
이전글 보기
카카오스타일의 멋진 여정을 소개하며 AWS AI Day Hackathon 고객 사례 시리즈의 세 번째 글을 마무리 하겠습니다. 다음 편에서는 또 다른 산업군의 흥미로운 구현 사례를 소개할 예정이니 많은 관심 부탁드립니다. Stay tuned!