发布于: Apr 30, 2024
Amazon Titan Text Embeddings V2 是 Amazon Titan 系列模型中的一个新嵌入模型,现已在 Amazon Bedrock 中全面推出。使用 Titan Text Embeddings V2,客户可以通过将文本数据表示为数值向量(称为嵌入)来执行各种自然语言处理 (NLP) 任务。这些嵌入会捕获高维向量空间中单词、短语或文档之间的语义和上下文关系。此模型针对检索增强生成 (RAG) 应用场景进行了优化,也非常适合各种其他任务,例如信息检索、问答聊天机器人、分类和个性化推荐。
Amazon Text Embeddings V2 是一款轻量级、高效的模型,非常适合不同维度的高准确度检索任务。该模型支持灵活的嵌入大小(256、512、1,024),并优先维护较小维度的准确度,有助于在不影响准确度的前提下降低存储成本。当将维度从 1,024 减少到 512 时,Titan Text Embeddings V2 可保留大约 99% 的检索准确度;当将维度从 1,024 减少到 256 时,该模型可保留 97% 的准确度。此外,Titan Text Embeddings V2 还包括预训练中对 100 多种语言的多语言支持,以及用于提高测量向量相似度的准确度的单位向量标准化。
Amazon Titan Text Embeddings V2 现已在美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)AWS 区域推出。要了解更多信息,请阅读 AWS 新闻发布博客、Amazon Titan 产品页面和文档。要开始在 Amazon Bedrock 中使用 Titan Text Embeddings V2,请访问 Amazon Bedrock 控制台。