게시된 날짜: Sep 28, 2023
Amazon Titan Embeddings는 단일 단어, 구문, 심지어 대형 문서와 같은 자연어 텍스트를 시맨틱 유사성을 기반으로 검색, 개인화, 클러스터링과 같은 사용 사례를 지원하는 데 사용할 수 있는 숫자 표현으로 변환하는 텍스트 임베딩 모델입니다. 검색 증강 생성(RAG) 사용 사례를 지원하기 위해 텍스트 검색에 최적화된 Amazon Titan Embeddings를 사용하면 먼저 텍스트 데이터를 숫자 표현이나 벡터로 변환한 다음, 해당 벡터를 사용하여 벡터 데이터베이스에서 관련 구절을 정확하게 검색할 수 있으므로, 다른 파운데이션 모델(FM)과 조합하여 독점 데이터를 최대한 활용할 수 있습니다.
Titan Embeddings는 영어, 중국어, 스페인어 등 25개 이상의 언어를 지원합니다. 최대 8,192개의 토큰을 입력할 수 있으므로 사용 사례에 따라 단일 단어, 구문 또는 전체 문서로 작업하기에 적합합니다. 이 모델은 1,536차원의 출력 벡터를 반환하여 높은 정확도를 제공하는 동시에 지연 시간이 짧고 비용 효율적인 결과를 제공하도록 최적화합니다. Titan Embeddings는 Amazon Bedrock의 서버리스 경험을 통해 제공되므로 인프라 관리 없이 단일 API를 사용하여 손쉽게 액세스할 수 있습니다.
Amazon Titan Embeddings는 미국 동부(버지니아 북부) 및 미국 서부(오레곤) AWS 리전을 비롯하여 Amazon Bedrock이 제공되는 모든 AWS 리전에서 사용할 수 있습니다. Amazon Titan으로 생성형 AI 앱 구축을 시작하려면 Amazon Titan 웹 페이지를 살펴보세요.