게시된 날짜: Apr 30, 2024

Amazon Titan 모델 제품군의 새로운 임베딩 모델인 Amazon Titan Text Embeddings V2를 이제 Amazon Bedrock에서 정식 버전으로 제공됩니다. 고객은 Titan Text Embeddings V2를 사용하여 텍스트 데이터를 임베딩이라고 하는 숫자 벡터로 표현함으로써 다양한 자연어 처리(NLP) 작업을 수행할 수 있습니다. 이러한 임베딩은 고차원 벡터 공간에서 단어, 구문 또는 문서 간의 의미론적 및 문맥적 관계를 캡처합니다. 이 모델은 검색 증강 생성(RAG) 사용 사례에 최적화되어 있으며 정보 검색, 질의응답 챗봇, 분류 및 개인화된 추천과 같은 다양한 작업에도 적합합니다.

Amazon Text Embeddings V2는 가볍고 효율적인 모델로서 다양한 차원에서 높은 정확도의 검색 작업에 적합합니다. 이 모델은 유연한 임베딩 크기(256, 512, 1,024)를 지원하며 더 작은 차원 크기에서 정확도 유지 관리에 우선순위를 두어 정확도 저하 없이 스토리지 비용을 절감하도록 도와줍니다. Titan Text Embeddings V2는 1,024차원에서 512차원으로 축소할 경우 약 99%의 검색 정확도를 유지하고, 1,024차원에서 256차원으로 축소할 경우 97%의 모델 정확도를 유지합니다. 또한 Titan Text Embeddings V2에는 사전 훈련에서 100개 이상의 언어에 대한 다국어 지원과 벡터 유사성 측정의 정확도 향상을 위한 단위 벡터 정규화 기능이 포함되어 있습니다. 

Amazon Titan Text Embeddings V2는 미국 동부(버지니아 북부) 및 미국 서부(오레곤) AWS 리전에서 사용할 수 있습니다. 자세한 내용을 알아보려면 AWS 뉴스 출시 블로그, Amazon Titan 제품 페이지설명서를 살펴보세요. Amazon Bedrock에서 Titan Text Embeddings V2를 시작하려면 Amazon Bedrock 콘솔로 이동하세요.