Présentation du modèle de vectorisation binaire pour le plongement lexical Titan dans Amazon Bedrock

Publié le: 19 nov. 2024

Le plongement lexical Amazon Titan V2 prend désormais en charge les vectorisations binaires. Grâce aux vectorisations binaires, les clients peuvent réduire les coûts de stockage de leurs applications RAG (génération à enrichissement contextuel) tout en conservant une précision similaire à celle des vectorisations classiques.

Le modèle de plongement lexical Amazon Titan génère des représentations sémantiques de documents, de paragraphes et de phrases sous forme de vecteurs en 1 024 (par défaut), 512 ou 256 dimensions. Avec les vectorisations binaires, le plongement lexical Titan V2 représentera les données sous forme de vecteurs binaires, chaque dimension étant codée sous la forme d'un seul chiffre binaire (0 ou 1). Cette représentation binaire convertit les données de grande dimension en un format plus efficace pour le stockage dans Amazon OpenSearch sans serveur dans les bases de connaissances Bedrock pour des applications RAG rentables.

La vectorisation binaire est prise en charge dans le plongement lexical Titan V2, Amazon OpenSearch sans serveur et les bases de connaissances Amazon Bedrock dans toutes les régions où le plongement lexical Amazon Titan V2 est pris en charge. Pour en savoir plus, consultez la documentation relative aux vectorisations binaires.