AWS 기술 블로그
Category: Artificial Intelligence
Amazon Bedrock에서 DeepSeek-R1 Distilled Llama 모델 배포하기
오픈 파운데이션 모델(Open Foundation Models, FM)은 생성형AI 혁신의 초석이 되어, 조직들이 비용과 배치 전략을 통제하면서 AI 애플리케이션을 구축하고 맞춤화할 수 있도록 해줍니다. AI 커뮤니티는 공개적으로 이용 가능한 고품질의 모델을 제공함으로써, 개발자와 최종 사용자 모두에게 이익이 되는 신속한 반복, 지식 공유, 비용 효율적인 솔루션을 촉진합니다. AI 기술 발전에 주력하는 연구 회사인 DeepSeek AI는 이 생태계에 크게 […]
AWS가 제공하는 완전관리형 병렬 파일시스템, Amazon FSx for Lustre – 2
이전 블로그에서는 병렬 파일시스템의 기본 개념과 특징 그리고 대표적인 병렬 파일시스템인 Lustre에 대해 살펴보았습니다. 또한 AWS에서 제공하는 완전 관리형 Lustre 파일시스템인 Amazon FSx for Lustre에 대해서도 알아보았습니다. 병렬 파일시스템은 무엇이고 왜 필요할까? 지구상에서 가장 인기있는 병렬 파일시스템, Lustre 파일시스템 알아보기 AWS가 제공하는 완전 관리형 병렬 파일시스템, Amazon FSx for Lustre – 1 이번 블로그는 시리즈의 […]
AI 응답성 최적화하기: Amazon Bedrock 지연 시간 최적화 추론에 대한 실용적인 가이드
이 글은 AWS Machine Learning 블로그의 Optimizing AI responsiveness: A practical guide to Amazon Bedrock latency-optimized inference by Ishan Singh, Ankur Desai, Rupinder Grewal, Vivek Singh, and Yanyan Zhang의 한국어 번역입니다. 상용 생성형AI 애플리케이션에서 반응성은 모델의 성능(정확도)만큼이나 중요합니다. 시간에 민감한 문의 사항을 처리하는 고객 서비스 팀이든, 즉각적인 코드 제안이 필요한 개발자이든, 지연 시간(대기 시간)으로 알려진 1초의 지연도 상당한 영향을 미칠 […]
비정형 데이터! Amazon Bedrock으로 제대로 활용하기
오늘날 기업들은 전례 없는 규모의 비정형 데이터를 보유하고 있습니다. 이메일, 문서, 이미지, 동영상, 소셜 미디어 게시물 등 다양한 형태의 비정형 데이터는 모든 엔터프라이즈 데이터에서 80%~90%를 차지하고 있으며, 정형 데이터보다 몇 배나 빠르게 증가하고 있습니다. 이러한 방대한 비정형 데이터에는 시장 트렌드, 고객 니즈, 운영상의 문제점 등 귀중한 인사이트가 있습니다. 하지만 약 18%의 기업만이 이러한 데이터를 효과적으로 […]
Amazon Bedrock과 Amazon Neptune으로 지식 그래프를 활용한 GraphRAG 애플리케이션 구축하기
이 글은 AWS Database 블로그의 Using knowledge graphs to build GraphRAG applications with Amazon Bedrock and Amazon Neptune의 한국어 번역입니다. 검색 증강 생성(Retrieval Augmented Generation, RAG)은 대규모 언어 모델과 외부 지식 소스를 결합하는 혁신적인 접근 방식으로, 더 정확하고 정보가 풍부한 콘텐츠 생성을 가능하게 합니다. 이 기술은 언어 모델의 맥락 이해 및 일관된 응답 생성 능력과 […]
SK하이닉스의 RAG 플랫폼 구축 및 성능 평가/분석 연구 사례
이 블로그는 SK hynix 오세진 TL, 노정기 TL, 오태진 TL 이 함께 작성하였습니다. SK 하이닉스는 AI 시대라는 새로운 세상의 중심에 반도체가 있다는 사명감을 가지고 최고의 기술력을 향해 끊임없는 혁신을 이뤄 가고 있습니다. 세계 최고 성능의 HBM3를 최초 개발 및 출시한 데 이어 확장 버전인 HBM3E 역시 세계 최초 양산에 성공하며 메모리 반도체 시장을 선도하고 있고, 세계 […]
AWS가 제공하는 완전 관리형 병렬 파일시스템, Amazon FSx for Lustre – 1
이전 글에서는 병렬 파일시스템의 기본 개념과 특징, 그리고 대표적인 병렬 파일시스템인 Lustre에 대해 살펴보았습니다. 병렬 파일시스템은 무엇이고 왜 필요할까? 지구상에서 가장 인기있는 병렬 파일시스템, Lustre 파일시스템 알아보기 이번에는 AWS가 제공하는 완전 관리형 병렬 파일시스템 서비스인 Amazon FSx for Lustre를 알아보겠습니다. What is Amazon FSx for Lustre? 고성능 컴퓨팅(HPC) 환경에서는 대량의 데이터를 신속하게 처리해야 하며, 이를 […]
생성형 AI로 실현하는 장애 대응부터 지식 자산화까지: Amazon Bedrock, Slack 그리고 Atlassian Confluence 통합 지능형 시스템
배경 및 문제 정의 현대의 IT 인프라 환경은 그 규모와 복잡성이 기하급수적으로 증가하고 있습니다. 클라우드 네이티브 아키텍처의 도입이나 마이크로서비스 기반 애플리케이션의 확산으로 기업의 IT 운영팀이 대응해야 할 영역은 지속적으로 확장되고 있습니다. 특히 시스템 전반에서 발생하는 다양한 종류의 로그 데이터, 메트릭 그리고 메시지들을 효과적으로 분석하고 신속하게 대응하는 것이 중요한 과제로 떠오르고 있습니다. 신속한 장애 대응의 필요성 […]
티머니의 MLOps 구현 사례 : Amazon SageMaker를 활용한 배차모델 자동화 및 배포
이 블로그는 티머니의 반용주 매니저, 구현서 매니저, 오지훈 매니저와 함께 작성되었습니다 티머니는 ‘이동을 편하게, 세상을 이롭게’를 경영철학으로, ‘더 편한 이동과 결제를 위한 플랫폼 기업’으로 성장하고 있습니다. 티머니는 세계적으로 기술력을 인정 받고 있는 ‘티머니 교통카드 시스템’을 기반으로 대중교통 정산 및 모바일티머니 서비스를 제공하며, 뉴질랜드, 말레이시아, 몽골 등 전 세계에 교통카드 시스템을 수출하고 있습니다. 티머니는 ‘고객’과 ‘공익성’을 […]
Amazon Bedrock Guardrails로 LLM 스트리밍 출력 보호하기
생성형 AI 기술의 발전과 함께, AI 모델의 입출력을 안전하고 신뢰할 수 있게 만드는 것이 중요한 과제로 대두되고 있습니다. 특히 대규모 언어 모델(LLM, Large Language Model)이 생성하는 콘텐츠를 제어하고 보호하는 메커니즘의 필요성이 더욱 커지고 있습니다. 이러한 배경에서 Amazon Bedrock에서는 Amazon Bedrock Guardrails라는 강력한 도구를 제공하여 LLM 애플리케이션의 안전성 및 신뢰성을 높이고 있습니다. Amazon Bedrock Guardrails는 기업들이 […]