Publié le: Apr 30, 2024
Amazon Titan Text Embeddings V2, un nouveau modèle d'intégration de la famille de modèles Amazon Titan, est désormais disponible pour tous dans Amazon Bedrock. Grâce à Titan Text Embeddings V2, les clients peuvent effectuer diverses tâches de traitement du langage naturel (NLP) en représentant les données textuelles sous forme de vecteurs numériques, appelés intégrations. Ces intégrations capturent les relations sémantiques et contextuelles entre des mots, des phrases ou des documents dans un espace vectoriel de grande dimension. Ce modèle est optimisé pour les cas d'utilisation des générations augmentées par extraction (RAG) et convient également à diverses autres tâches telles que la recherche d'informations, les chatbots de questions-réponses, la classification et les recommandations personnalisées.
Amazon Text Embeddings V2 est un modèle léger et efficace, idéal pour les tâches de récupération de haute précision à différentes dimensions. Le modèle prend en charge des tailles d'intégration flexibles (256, 512, 1 024) et donne la priorité au maintien de la précision dans les plus petites dimensions, ce qui permet de réduire les coûts de stockage sans compromettre la précision. Lors de la réduction de la dimension 1 024 à 512, Titan Text Embeddings V2 conserve une précision de récupération d'environ 99 %, et lors de la réduction de la dimension 1 024 à 256, le modèle conserve une précision de 97 %. En outre, Titan Text Embeddings V2 inclut la prise en charge multilingue de plus de 100 langues lors de la pré-formation ainsi que la normalisation des vecteurs unitaires pour améliorer la précision de la mesure de la similitude des vecteurs.
Amazon Titan Text Embeddings V2 est disponible dans les régions AWS USA Est (Virginie du Nord) et USA Ouest (Oregon). Pour en savoir plus, consultez le blog de lancement d'AWS News, la page produit d'Amazon Titan et la documentation. Pour commencer à utiliser Titan Text Embeddings V2 dans Amazon Bedrock, rendez-vous sur la console Amazon Bedrock.