Amazon Web Services 한국 블로그
Amazon Bedrock 지식 기반, Amazon Aurora, PostgreSQL 및 Cohere 임베딩 모델 지원
AWS re:Invent 2023에서 Amazon Bedrock용 지식 기반의 정식 출시를 발표했습니다. 지식 기반을 사용하면 Amazon Bedrock의 파운데이션 모델(FM)을 회사 데이터에 안전하게 연결하여 검색 증강 생성(RAG)을 지원할 수 있습니다.
이전 게시물에서는 Amazon Bedrock용 지식 기반이 사용자의 엔드 투 엔드 RAG 워크플로를 관리하는 방법을 설명했습니다. 데이터의 위치를 지정하고, 데이터를 벡터 임베딩으로 변환할 때 사용할 임베딩 모델을 선택한 후 다음 그림과 같이 Amazon Bedrock에서 벡터 데이터를 저장할 벡터 스토어를 계정에 생성하면 됩니다. 예를 들어 사용자 지정 벡터 스토어를 지정하여 RAG 워크플로를 사용자 지정할 수도 있습니다.
지난 11월에 게시물을 올린 이후로 Amazon Aurora PostgreSQL-호환 버전을 Amazon OpenSearch Serverless 벡터 엔진, Pinecone, Redis Enterprise Cloud 다음으로 사용자 지정 벡터 스토어 옵션으로 추가하는 내용을 포함해 지식 기반에 대한 많은 업데이트가 있었습니다. 그런데 이것이 전부가 아닙니다. 새로운 내용을 간단히 살펴보도록 하겠습니다.
임베딩 모델 추가 선택 가능 항목
임베딩 모델은 문서와 같은 데이터를 벡터 임베딩으로 변환합니다. 벡터 임베딩이란 문서 내 텍스트 데이터를 숫자로 표현한 것입니다. 각 임베딩은 데이터의 의미론적 또는 문맥상 의미를 캡처하는 것을 목표로 합니다.
Cohere Embed v3 – 이제 Amazon Titan 텍스트 임베딩 외에도 Cohere Embed 영어 및 Cohere Embed 다국어의 두 가지 임베딩 모델 중에서 선택할 수도 있습니다. 각각은 1,024 크기를 지원합니다.
Cohere 블로그에서 Cohere Embed v3 모델에 대해 자세히 알아보세요.
벡터 스토어 추가 선택 가능 항목
각 벡터 임베딩은 벡터 스토어에 저장되며, 임베딩이 생성된 원본 콘텐츠에 대한 참조와 같은 추가 메타데이터가 포함되는 경우가 많습니다. 벡터 스토어는 저장된 벡터 임베딩을 인덱싱하므로 관련 데이터를 빠르게 검색할 수 있습니다.
지식 기반은 계정에 벡터 데이터를 저장할 벡터 스토어 생성을 포함하는 완전 관리형 RAG 환경을 제공합니다. 지원되는 옵션 목록에서 사용자 지정 벡터 스토어를 선택하고 벡터 데이터베이스 인덱스 이름과 인덱스 필드 및 메타데이터 필드 매핑을 제공할 수 있습니다.
벡터 스토어에 대한 최근 세 가지 업데이트를 통해 강조하고 싶습니다. 지원되는 사용자 지정 벡터 스토어 목록에 Amazon Aurora PostgreSQL 호환 및 Pinecone 서버리스가 추가되었고, 개발 및 테스트 워크로드의 비용을 절감하는 데 도움이 되는 기존 Amazon OpenSearch Serverless 통합에 대한 업데이트도 포함됩니다.
Amazon Aurora PostgreSQL – Amazon OpenSearch Serverless 벡터 엔진, Pinecone 및 Redis Enterprise Cloud 외에도 이제 Amazon Aurora PostgreSQL을 지식 기반의 벡터 데이터베이스로 선택할 수 있습니다.
Aurora는 MySQL 및 PostgreSQL과 완벽하게 호환되는 관계형 데이터베이스 서비스입니다. 이를 통해 수정하지 않고도 기존 애플리케이션과 도구를 실행할 수 있습니다. Aurora PostgreSQL은 벡터 임베딩을 저장, 인덱싱 및 쿼리할 수 있는 오픈 소스 pgvector 확장을 지원합니다.
일반 데이터베이스 워크로드를 위한 Aurora의 기능 중 상당수는 벡터 임베딩 워크로드에도 적용됩니다.
- Aurora는 오픈 소스 PostgreSQL과 비교할 때 최대 3배의 데이터베이스 처리량을 제공하므로 Amazon Bedrock의 벡터 작업까지 확장할 수 있습니다.
- Aurora Serverless v2는 Amazon Bedrock의 실시간 쿼리 로드를 기반으로 스토리지 및 컴퓨팅 파워를 탄력적으로 확장하여 최적의 프로비저닝을 보장합니다.
- Aurora 글로벌 데이터베이스는 여러 AWS 리전에서 지연 시간이 짧은 글로벌 읽기 및 재해 복구를 제공합니다.
- 블루/그린 배포는 동기화된 스테이징 환경에서 프로덕션 데이터베이스를 복제하므로 프로덕션 환경에 영향을 주지 않고 수정할 수 있습니다.
- Amazon EC2 R6gd 및 R6id 인스턴스의 Aurora 최적화된 읽기는 로컬 스토리지를 사용하여 복잡한 쿼리 및 인덱스 재구축 작업의 읽기 성능과 처리량을 향상시킵니다. 메모리에 맞지 않는 벡터 워크로드의 경우 Aurora Optimized Reads는 동일한 크기의 Aurora 인스턴스보다 최대 9배 더 나은 쿼리 성능을 제공할 수 있습니다.
- Aurora는 Secrets Manager, IAM 및 RDS 데이터 API와 같은 AWS 서비스와 원활하게 통합되므로 Amazon Bedrock에서 데이터베이스로 안전하게 연결하고 SQL을 사용한 벡터 작업을 지원합니다.
Aurora를 지식 기반용으로 구성하는 방법에 대한 자세한 내용은 AWS 데이터베이스 블로그의 이 게시물과 Aurora 사용 설명서를 참조하세요.
Pinecone 서버리스 – Pinecone은 최근 Pinecone 서버리스를 출시했습니다. 지식 기반에서 사용자 지정 벡터 스토어로 Pinecone을 선택하면 Pinecone 또는 Pinecone 서버리스 구성 세부 정보를 입력할 수 있습니다. 두 옵션 모두 지원됩니다.
Amazon OpenSearch Serverless의 개발 및 테스트 워크로드 비용 절감
이 옵션을 선택하여 새로운 벡터 스토어를 빠르게생성하면 Amazon Bedrock이 사용자 계정의 Amazon OpenSearch Serverless에 벡터 인덱스를 생성하므로 사용자가 직접 관리하지 않아도 됩니다.
11월에 정식 출시되었던 Amazon OpenSearch Serverless 벡터 엔진을 사용하면 개발 및 테스트 워크로드에 대한 중복 복제본을 비활성화할 수 있어 비용이 절감됩니다. OpenSearch 컴퓨팅 유닛(OCU) 두 개만으로 시작할 수 있습니다. 하나는 인덱싱용이고 다른 하나는 검색용이므로 중복 복제본을 사용할 때보다 비용을 절반으로 줄일 수 있습니다. 또한 분할 OCU 청구는 0.5 OCU부터 시작하여 필요에 따라 확장할 수 있어 비용을 더욱 절감할 수 있습니다. 개발 및 테스트 워크로드의 경우 이제 최소 1OCU(인덱싱과 검색으로 분리)면 충분하므로 프로덕션 워크로드에 필요한 4개의 OCU에 비해 비용을 최대 75% 절감할 수 있습니다.
사용성 개선 – 이제 Amazon Bedrock용 지식 기반에서 빠른 생성 워크플로를 선택할 때 중복 복제본 비활성화가 기본 선택 항목이 됩니다. 필요에 따라 프로덕션 워크로드로 업데이트를 선택하여 중복 복제본이 포함된 컬렉션을 생성할 수 있습니다.
Amazon OpenSearch Serverless 벡터 엔진에 대한 자세한 내용은 Channy의 게시물을 참조하세요.
FM 추가 선택 가능 항목
런타임 시 RAG 워크플로는 사용자 쿼리로 시작됩니다. 임베딩 모델을 사용하여 사용자 입력 프롬프트의 벡터 임베딩 표현을 생성합니다. 그런 다음 이 임베딩을 사용하여 데이터베이스에 유사한 벡터 임베딩을 쿼리하면, 가장 연관성이 높은 텍스트가 쿼리 결과를 검색합니다. 그리고 쿼리 결과가 원래 프롬프트에 추가되고 증강 프롬프트가 FM으로 전달됩니다. 모델은 다음 그림과 같이 프롬프트의 추가 컨텍스트를 사용하여 완성된 정보를 생성합니다.
Anthropic Claude 2.1 – Anthropic Claude 인스턴트 1.2와 Claude 2 외에도 이제 Claude 2.1을 지식 기반용으로 선택할 수 있습니다. Claude 2.1은 이전 Claude 모델과 비교했을 때 지원되는 컨텍스트 창 크기를 두 배로 늘려 200K 토큰을 지원합니다.
Claude 2.1에 대해 자세히 알아보려면 Anthropic 블로그를 확인하세요.
정식 출시
임베디드 모델, 벡터 스토어 및 FM에 대한 추가 옵션을 포함한 Amazon Bedrock용 지식 기반은 미국 동부(버지니아 북부) 및 미국 서부(오레곤) AWS 리전에서 사용할 수 있습니다.
자세히 알아보기
Amazon Bedrock용 지식 기반에 대해 자세히 알아보기
- Amazon Aurora와 Amazon Bedrock용 지식 기반을 사용하여 생성형 AI 애플리케이션 구축(블로그 게시물)
- Amazon OpenSearch Serverless 벡터 엔진 출시(블로그 게시물)
— Antje