Amazon Neptune, 오픈 소스 GraphRAG 툴킷 지원
AWS는 오늘 오픈 소스 GraphRAG 툴킷의 지원을 발표했습니다. 이 GraphRAG 툴킷은 RAG 기술과 그래프 데이터를 함께 사용해 더욱 포괄적이고 관련성이 높으며 설명 가능한 응답을 제공함으로써 생성형 AI 애플리케이션을 개선할 수 있는 새로운 기능입니다. 이 툴킷은 비정형 데이터로부터 그래프 생성을 자동화하고, 사용자의 질문에 답변할 때 이 그래프를 쿼리하는 질문 답변 전략을 구성할 수 있는 오픈 소스 프레임워크를 제공합니다.
이전에는 고객이 다양한 콘텐츠에서 포괄적인 다단계 검색을 진행하기가 어려웠습니다. GraphRAG는 모든 검색 대상 문서에서 주요 엔터티를 식별하여 데이터 내의 관계를 활용하는 인사이트를 제공합니다. 그러므로 최종 사용자에게 더욱 정확한 응답이 제공됩니다. 예를 들어, 재무 분석가는 제조 회사의 판매 예측을 재무 분석 챗봇에 요청할 수 있습니다. 생성형 AI 애플리케이션을 구축하는 개발자는 데이터 소스를 지정하고, Amazon Neptune 데이터베이스 또는 Neptune Analytics를 그래프 저장소로 선택하고 Amazon OpenSearch Serverless를 벡터 저장소로 선택하여 이 새로운 오픈 소스 Python 툴킷을 통해 GraphRAG를 활성화할 수 있습니다. 그러면 선택한 벡터 저장소에 벡터 임베딩이 자동으로 생성 및 저장되고, 선택한 그래프 저장소에 엔티티와 그 관계의 그래프 표현이 함께 저장됩니다.
GraphRAG 툴킷은 오픈 소스 프로젝트입니다. 코드 베이스는 검사, 수정, 확장이 가능하므로, 특정 또는 틈새 요구 사항에 맞게 유연하게 조정할 수 있습니다. 이 툴킷은 초기 릴리스에서 Neptune Analytics와 Neptune Database 모두를 위한 그래프 저장소 구현과 Neptune Analytics 및 OpenSearch Serverless를 위한 벡터 저장소 구현을 제공하며, Amazon Bedrock에서 호스팅된 FM을 사용합니다. 자세한 내용은 사용 설명서에서 확인하세요.