Amazon Nova Multimodal Embeddings 발표
에이전틱 RAG 및 시맨틱 검색을 위한 최첨단 임베딩 모델인 Amazon Nova Multimodal Embeddings의 정식 버전이 출시되었습니다. 단일 모델을 통해 텍스트, 문서, 이미지, 비디오, 오디오를 지원하는 최초의 통합 임베딩 모델로, 선도적인 정확도로 크로스 모달 검색이 가능합니다.
기존에는 다양한 컨텐츠 유형을 관리하고 검색하기 위해 여러 개의 특수 임베딩 모델이 필요했기 때문에 복잡성, 높은 비용, 데이터 사일로 현상이 발생했습니다. Amazon Nova Multimodal Embeddings은 다양한 콘텐츠 유형을 최고 수준의 정확도로 통합된 공간에 매핑하여 이러한 사일로를 해소하는 데 도움이 됩니다. 개발자는 단일 임베딩 모델을 활용하여 복잡한 쿼리로 동영상 아카이브를 검색하거나, 고객 질문에 기반해 관련 제품 이미지를 찾거나, 인포그래픽과 텍스트 설명이 모두 포함된 금융 문서를 검색하는 등 크로스 모달 애플리케이션을 구축할 수 있습니다.
이 모델은 최대 8K 토큰 길이의 입력과 최대 30초 길이의 비디오/오디오 세그먼트를 지원하며, 대용량 파일을 분할할 수도 있습니다. 다중 출력 임베딩 차원을 통해 조직은 정확도 및 성능과 스토리지 및 계산 비용 간의 균형을 맞출 수 있습니다. 조직은 실시간에 가까운 애플리케이션을 위한 동기식 API와 대용량 파일의 효율적인 처리를 위한 비동기식 API 중 하나를 선택할 수 있어, 지연 시간에 민감한 워크로드와 대량 워크로드 모두에 맞게 최적화할 수 있습니다.
Amazon Nova Multimodal Embeddings은 미국 동부(버지니아 북부)의 Amazon Bedrock에서 사용할 수 있습니다.
자세한 내용은 AWS 뉴스 블로그 및 사용 설명서를 참조하세요. Amazon Bedrock에서 Nova Multimodal Embeddings 사용을 시작하려면 Amazon Bedrock 콘솔로 이동하세요.