发布于: Sep 28, 2023
Amazon Titan Embeddings 是一种文本嵌入模型,可将自然语言文本(包括一个单词、短语甚至大型文档)转换为数字表示形式,可用于为基于语义相似度的搜索、个性化和集群等用例提供支持。Amazon Titan Embeddings 针对文本检索进行了优化,支持检索增强生成 (RAG) 用例,借助该模型,您可以先将文本数据转换为数字表示形式或向量,然后使用这些向量从向量数据库中准确搜索相关段落,这样您就能充分利用自己的专有数据与其他基础模型 (FM) 的组合。
Titan Embeddings 支持超过 25 种语言,包括英语、中文和西班牙语。您最多可以输入 8192 个令牌,因此非常适合根据您的用例处理一个单词、短语或整个文档。该模型可返回 1,536 个维度的输出向量,使其具有高度准确性,同时还进行了优化以实现低延迟和富有成本效益的结果。由于 Titan Embeddings 可通过 Amazon Bedrock 的无服务器体验获得,因此您可以使用单个 API 轻松访问它,无需管理任何基础设施。
Amazon Titan Embeddings 已在所有提供 Amazon Bedrock 的 AWS 区域推出,包括美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)AWS 区域。要开始使用 Amazon Titan 构建生成式人工智能应用程序,请参阅 Amazon Titan 网页。