Amazon SageMaker | AWS 기술 블로그

Amazon OpenSearch Service 의 LTR 플러그인을 활용한 검색 품질 개선

개요 Amazon OpenSearch Service는 BM25(Best Match 25)라는 확률론적 순위 알고리즘을 사용하여 문서와 검색 키워드간 관련성 점수를 계산합니다. 문서에 고유 키워드가 더 자주 나타난다면 BM25 알고리즘은 해당 문서에 더 높은 점수를 부여합니다. 이는 검색 서비스에서 사용하는 인기 있는 알고리즘으로 사용자의 검색 의도에 맞게 키워드의 가중치를 조정하여 결과를 정렬합니다. 하지만, 이 알고리즘은 CTR(Click-through rate)과 같은 사용자의 행위는 […]

SK하이닉스의 RAG 플랫폼 구축 및 성능 평가/분석 연구 사례

이 블로그는 SK hynix 오세진 TL, 노정기 TL, 오태진 TL 이 함께 작성하였습니다. SK 하이닉스는 AI 시대라는 새로운 세상의 중심에 반도체가 있다는 사명감을 가지고 최고의 기술력을 향해 끊임없는 혁신을 이뤄 가고 있습니다. 세계 최고 성능의 HBM3를 최초 개발 및 출시한 데 이어 확장 버전인 HBM3E 역시 세계 최초 양산에 성공하며 메모리 반도체 시장을 선도하고 있고, 세계 […]

티머니의 MLOps 구현 사례 : Amazon SageMaker를 활용한 배차모델 자동화 및 배포

이 블로그는 티머니의 반용주 매니저, 구현서 매니저, 오지훈 매니저와 함께 작성되었습니다 티머니는 ‘이동을 편하게, 세상을 이롭게’를 경영철학으로, ‘더 편한 이동과 결제를 위한 플랫폼 기업’으로 성장하고 있습니다. 티머니는 세계적으로 기술력을 인정 받고 있는 ‘티머니 교통카드 시스템’을 기반으로 대중교통 정산 및 모바일티머니 서비스를 제공하며, 뉴질랜드, 말레이시아, 몽골 등 전 세계에 교통카드 시스템을 수출하고 있습니다. 티머니는 ‘고객’과 ‘공익성’을 […]

Amazon S3 데이터 레이크와 기계학습을 위한 Snowflake 통합 파이프라인 플랫폼 구축하기

인공지능과 기계학습 기술의 상용화로, 기업들은 대량의 데이터를 효과적으로 수집, 저장, 관리할 필요성을 점차 인식하고 있습니다. 데이터 레이크(Data Lake)는 이러한 필요성에 부응하여, 다양한 소스로부터 대규모의 데이터를 실시간으로 수집하고 저장함으로써 기업의 의사결정과 혁신을 지원합니다. 이제 데이터 레이크는 기업이 데이터 자산을 최대한 활용하고 비즈니스 가치를 창출하는 핵심 요소로 자리 잡고 있습니다. 정형, 반정형, 비정형 데이터 등 다양한 유형의 […]

자동차 산업을 위한 AWS re:Invent 2024 요약

이 글은 AWS for Industries 블로그에 게시된 글 (AWS re:Invent 2024 recap for the Automotive Industry)를 한국어로 번역 및 편집하였습니다. AWS의 대표적인 연례 컨퍼런스 AWS re:Invent 2024에서, 2024년 12월 2일부터 6일까지 한주 동안 AWS는 기조연설, 브레이크아웃 세션, 신제품 출시, 그리고 다양한 데모를 통하여 최신 혁신과 서비스를 공개하였습니다. 본 요약은 자동차 산업과 관련된 주요 발표 내용, […]

Cohere Rerank를 사용한 RAG 성능 향상

검색 증강 생성(RAG)은 기업이 실시간 데이터를 통합하고 독점 데이터를 사용하여 더욱 풍부하고 상호작용적인 대화를 가능하게 하는 Generative AI(생성형 AI) 애플리케이션을 개발할 수 있도록 돕는 강력한 기술입니다. RAG를 활용하면 이러한 AI 애플리케이션이 외부의 신뢰할 수 있는 도메인별 데이터를 효과적으로 사용하여 사용자 쿼리에 대한 언어 모델의 문맥을 강화할 수 있습니다. 하지만, 응답의 신뢰성과 정확도는 적절한 도메인 데이터를 […]

이미지 비디오 Multi-modal 추론 모델, LLaVA-NeXT-Video 모델을 Amazon SageMaker에 배포하기

LLaVA-NeXT-Video 모델 소개 LLaVA-NeXT-Video 모델은 LLaVA-NeXT의 후속 모델로, 비디오 이해 능력을 강화한 대형 멀티모달 모델 (Large Multimodal Model, LMM)입니다. 이 모델은 주로 텍스트-이미지 데이터로 학습된 LLaVA-NeXT를 기반으로 하여 비디오 데이터에 대한 성능을 향상시키기 위해 개발되었습니다. 주요 특징 제로샷(Zero-shot) 비디오 표현 능력: LLaVA-NeXT-Video는 AnyRes 기술을 활용하여 고해상도 이미지를 여러 이미지로 분할하고, 이를 사전 학습된 비전 트랜스포머 […]

프리킥 챌린지를 위한 생성형 AI 솔루션을 AWS 서비스로 구현하기

이 블로그에서 소개하는 AWS Seoul Summit 2024 “AWS 프리킥 챌린지”에서는 기존의 슈팅 속도 확인 서비스에 더해, 참가자들에게 특별한 경험을 선사하기 위해 생성형 AI 서비스를 도입했습니다. 챌린지 참가자들은 프리킥 슈팅 후 자신의 슬로우 킥 모션을 분석한 영상을 제공받으며, 자신이 유니폼을 착용한 모습으로 합성된 기념 사진을 받을 수 있습니다. 또한, 현장에 직접 참석하지 않더라도 실시간 라이브 중계를 […]

Amazon SageMaker와 Airflow를 이용한 SK브로드밴드의 MLOps 플랫폼 구축 사례

SK브로드밴드는 ASDL 상용화, Pre-IPTV 서비스 제공 등 통신 방송 시장을 선도하며, 동시에 미디어 비즈니스 모델 다변화를 통한 종합 미디어 플랫폼 기업으로 성장하고 있습니다. SK텔레콤과 One Body 체계로 T-B 시너지를 극대화하여 AI/DT 기반 미디어, B2B, 인프라 분야를 확장해나가고 있습니다. 이제는 ‘AI COMPANY’라는 전사 지향점을 중심으로 비즈니스 전 영역에 걸친 AI 전환을 추진하여 사업 경쟁력을 지속적으로 강화해 […]

AWS CDK를 활용한 OpenAI Whisper 모델 Amazon SageMaker Endpoint 배포 자동화

OpenAI Whisper 모델은 MIT 라이선스를 가진 자동 음성 인식(Automatic Speech Recognition, ASR) 및 음성 번역을 위한 사전 훈련 모델입니다. OpenAI Whisper 모델은 CNN과 Transformer 아키텍처를 결합한 모델로, 68만 시간의 라벨링된 데이터로 훈련되었으며, 작은 크기에도 불구하고 높은 정확도를 보입니다. 특히 파인튜닝(fine-tuning) 없이도 다양한 데이터셋과 도메인에 잘 일반화되는 것이 큰 장점입니다. 또한 전사(transcribe), 번역, 언어 식별, 발화자 […]

AWS 기술 블로그

Category: Amazon SageMaker