跳至主要内容

Amazon S3 Vectors

经过成本优化的具有人工智能功能的存储,其具备大规模存储和查询向量的原生支持能力,可将总成本最高降低 90%

什么是 S3 Vectors?

Amazon S3 Vectors 是首款支持原生存储和查询向量的云对象存储,为人工智能代理、人工智能推理以及存储在 Amazon S3 中的内容的语义搜索提供专用的、经过成本优化的向量存储服务。通过将上传、存储和查询向量的成本最高降低 90%,S3 Vectors 使创建和使用大型向量数据集变得更具成本效益,可用于改善人工智能代理的记忆和上下文以及 S3 数据的语义搜索结果。S3 Vectors 旨在提供与 Amazon S3 相同的弹性、规模和持久性,可让您以亚秒级的查询性能最多存储数十亿向量和搜索数据。它非常适合需要大规模构建和维护向量索引的应用程序,帮助您组织和搜索海量信息。

借助具备人工智能功能的存储实现更快的构建速度

使用 S3 Vectors,您可以从一组专用 API 中获益,以存储、访问和查询向量,而无需预置任何基础设施。S3 Vectors 现已与 Amazon Bedrock 知识库(包括 Amazon SageMaker 融通式合作开发工作室内)原生集成,使您能够降低检索增强生成(RAG)的成本。通过与 Amazon OpenSearch Service 的集成,您可以采用分层策略,将大型向量数据集存储在 S3 中,实现近乎实时的访问;而对性能要求较高的向量数据,则可以在 OpenSearch 中毫不费力地激活。

优势

将上传、存储和查询向量的成本最高降低 90%,同时仍能保持低于一秒的查询速度。转变您存储数百万乃至数十亿个向量的经济模式,摒弃昂贵的存储方式,仅按实际使用量付费即可。高效地扩展海量向量数据,无需进行基础设施管理,通过使用能够适应不断变化的工作负载的向量索引来组织数据,且无需进行任何预置操作。S3 Vectors 专为基于向量的 AI 应用场景而设计,在性能和效率之间实现了理想的平衡。

生成精细的向量嵌入,以便从包括图像、视频、音频和文本在内的非结构化数据中获得更深入的理解。针对向量搜索应用程序进行弹性扩展,以根据语义相似度提高粒度。无论是分析新闻内容、建立体育赛事精彩片段索引,还是处理医学图像和基因组数据,S3 Vectors 都能支持高容量工作负载,并保证查询性能的稳定以及灵活的扩展能力。

对于那些规模较大、存续时间较长且无需具备内存中向量数据库那种高吞吐量性能的向量数据,使用 S3 Vectors。虽然 Amazon OpenSearch Service 能够提供满足实时应用程序所需的高每秒查询量(QPS)和低延迟的向量搜索功能,但 S3 Vectors 通过提供经过成本优化的数据基础来加以补充,其查询性能针对长期存储和数据的低频访问进行了优化。您还能受益于一种具有强一致性保障的存储架构,该架构能确保后续的查询总是包含您最近添加的数据。

利用内置的连接功能,通过 Amazon OpenSearch Service 实现向量搜索,从而以优化的性价比实现高效运行;同时借助 Amazon Bedrock 知识库,以更低的成本实现增强型的 RAG 应用程序。在 Amazon SageMaker 融通式合作开发工作室中访问 Amazon Bedrock,以利用现有的项目配置文件构建基于推理的应用程序,创建一个集成、可扩展且可共享的 AI 开发环境,以加强团队间的协作。

使用案例

根据语义意义和相似性来精准定位搜索结果

对海量向量数据集进行语义和相似性搜索。媒体组织能够对数百万小时的视频建立索引,从而迅速呈现关键场景以制作精彩剪辑;而医疗保健机构则能够存储数十亿个代表医疗图像的向量嵌入,以便识别相似病例并加快诊断速度。使用 S3 Vectors,您能够在不牺牲规模的前提下以更低的成本释放非结构化数据的语义价值。

Missing alt text value

通过 Amazon Bedrock 集成降低 RAG 成本

通过将 S3 Vectors 与 Amazon Bedrock 知识库相结合,降低检索增强生成(RAG)的成本。通过使用您的 RAG 应用程序,将您的专有数据集转化为具有上下文感知能力的智能知识存储库。通过控制台、API、软件开发工具包或直接 Amazon SageMaker 融通式合作开发工作室中访问 S3 Vectors 中的可扩展向量数据以及 Amazon Bedrock 中的高性能基础模型和高级知识库,快速构建和自定义生成式人工智能应用程序。

Missing alt text value

构建具有扩展和持久记忆功能的更智能的人工智能代理

通过保留更多上下文、利用更丰富的数据进行推理,并利用经济实惠的大规模向量存储构建持久记忆,来使您的人工智能代理变得更加智能。以低成本将每一次互动、每一份文档以及每一条见解都存储在数 PB 的向量数据中,这样代理就不会被迫遗忘重要的背景信息。支持持续学习、历史背景考量、再训练以及微调操作,以推动更深入的智能代理发展。无论是用于代理记忆,还是在庞大的人工智能数据集上进行相似性搜索,S3 Vectors 都为存储和检索向量提供了经济高效的数据基础。

Missing alt text value

适用于任何规模开发的具有人工智能功能的存储

存储并快速访问任意数量的向量数据,从而快速启动您的人工智能项目。无需进行任何基础设施设置,S3 Vectors 就能让您立即将数据投入使用并开始进行人工智能开发。它还能够为复杂的人工智能应用程序处理严格的存储要求。无论您是在构建个性化引擎、自然语言处理系统,还是在处理庞大的代码库,S3 Vectors 都提供了经过成本优化的、具备人工智能功能的存储解决方案,能够根据您的需求进行扩展——从原型开发到实际生产的每一步,始终助力您加速人工智能创新进程。 

Missing alt text value

使用 Amazon OpenSearch Service 优化向量搜索的性价比

通过将 S3 Vectors 中具有行业领先优势的可扩展向量存储的经济性与 Amazon OpenSearch Service 的高性能搜索功能相结合,实现成本与性能的平衡,从而实现高吞吐量、低延迟的向量搜索。将 S3 Vectors 与 Amazon OpenSearch Service 配合使用,以降低不经常查询的向量的存储成本,然后随着需求的增加或者在需要增强搜索功能时,将其快速移至 OpenSearch 中。这种战略集成使您能够根据性能要求将向量工作负载分配到最合适的服务中,从而实现成本优化和出色的查询响应速度。

Missing alt text value

客户

Backlight

Backlight 一家全球性的媒体技术公司,它通过采用简单且基于人工智能的产品,来取代破损的媒体工作流。 通过其一整套解决方案,Backlight 使创意团队和制作团队能够集中精力创作出具有影响力、引人入胜的故事。

“我们拥有数百名客户,他们拥有长达 1000 小时以上的视频资料库,有些客户的视频库甚至多达数十万小时。他们需要明智地决定如何将内容分发给其拥有并运营的免费广告支持型流媒体电视(FAST)以及相关应用程序的受众。Amazon S3 Vectors 为我们提供了扩展智能媒体工作流的基础,使我们的客户能够利用可搜索的数据对海量资源库中的媒体内容进行丰富处理。”

Ed Laczynski,Backlight 的 Zype 总经理,Backlight

Missing alt text value

Twilio

Twilio 使企业能够利用通信和数据技术,在客户旅程的每一个环节中增强智能化和安全性。如今的领先企业都信赖 Twilio,借助其服务与客户建立起直接且个性化的联系。

“S3 Vectors 将一个易于访问的向量接口直接嵌入到了我们已经信赖的存储中,让我们只需单击一下操作,就能为我们提供与 S3 相同的规模,并具备语义搜索的智能功能。这种简单性使 Twilio 团队能够将强大的检索增强生成功能以及个性化推荐功能无缝集成到我们的客户互动平台中,而无需新建基础设施或面临调优方面的困扰。我们非常期待看到 S3 Vectors 如何帮助开发者将日常数据转化为更智能、更值得信赖的客户体验。”

Twilio 的人工智能、机器学习和数据主管兼流量智能副总裁 Zachary Hanif

Missing alt text value

TwelveLabs

TwelveLabs 是多模态人工智能领域的先驱,专注于研究先进的视频理解技术。其视频基础模型能够让组织以近乎人类的精准度来搜索、总结和分析其视频内容——不仅能够理解屏幕上所呈现的内容,还能洞察其背后丰富的背景信息和深层含义。

“视频中蕴含着世界上一些最为宝贵且尚未得到充分利用的信息,但此前这些信息一直被限制在耗时的繁琐人工操作流程之中无法获取。我们的基础模型能让我们的客户将数拍字节的视频资料转化为可搜索、可利用的知识。借助像 Amazon S3 Vectors 这样可扩展的基础设施,我们能够以企业规模实现语义搜索和视频分析——从而让团队能够专注于创新、决策和影响力方面的工作。”

TwelveLabs 联合创始人兼首席执行官 Jae Lee

Missing alt text value

Spice AI

Spice AI 能使用其便携式、开源的数据和人工智能计算引擎帮助企业
构建快速、准确且可扩展的 AI 应用程序以及代理。它整合
来自不同来源的数据和搜索,支持
跨云、边缘和本地系统的各种工作负载,从而简化了人工智能的开发过程。

“该行业正越来越多地依赖对象存储,因为随着人工智能应用程序和代理需要访问的数据量不断增加,这种存储方式变得愈发重要。Amazon S3 Vectors 令人极为兴奋,因为我们现在能够通过一个简单的解决方案同时获得 S3 的大规模存储、合理的价格、弹性扩展以及持久性,从而实现语义搜索和检索功能。我们已与 S3 团队合作,将 S3 Vectors 集成到 Spice.ai 开源的数据和人工智能计算引擎中,以提供一个简单的 SQL 接口,以便高效地管理和查询企业数据来源中的向量嵌入信息。

Spice AI 创始人兼首席执行官 Luke Kim

Missing alt text value

xCures

xCures 运营着一个由人工智能辅助的医疗数据平台,该平台能够从汇总、结构化且标准化的医疗记录中提取临床信息。

“S3 Vectors 为 Amazon OpenSearch Service 提供了经济高效的向量管理补充方案,帮助我们实现高效扩展,同时满足不同工作负载所需的性能要求。这使我们能够更有效地从医疗记录中识别出有意义的临床内容,并支持大规模的高质量结构化数据提取工作。”

xCures 产品管理副总裁 Zach Kaufman

Missing alt text value

BMW

BMW Group 是全球领先的高端汽车及摩托车制造商,旗下拥有 BMW、MINI、Rolls-Royce 和 BMW Motorrad 等品牌。

“云数据中心是 BMW Group 的核心数据平台,它通过 Apache Iceberg 管理存储在 S3 上、由 BMW 精心筛选并涵盖广泛内容的各类数据集。为了提高整个组织内基于人工智能的数据可用性,BMW 正在开发一种混合搜索解决方案,以将其结构化 iceberg 数据与现在也包含半结构化列数据的内容进行整合。之所以选择 S3 Vectors,是因为它在成本与性能方面达到了最佳平衡,同时它还与现有的 S3 Iceberg 架构以及身份与访问管理框架实现了兼容。”

BMW 的云数据中心产品管理主管 Ruben Simon

Missing alt text value

Precisely

Precisely 是数据完整性方面的可靠合作伙伴,拥有数十年在软件、数据及数据策略服务领域的深厚专业知识。其产品组合能够帮助整合客户数据、提升数据质量、规范数据使用、对位置数据进行地理编码和分析,并通过补充数据集来丰富这些数据,从而为企业的决策提供可靠依据。

“我们非常期待探索亚 Amazon S3 Vectors 的潜力,以使我们基于人工智能的数据发现和元数据管理能力具备更具成本效益的灵活性。”

Precisely 首席技术官 Tendu Yogurtcu

Missing alt text value

Nomad Media

Nomad Media 提供一个基于 AWS 构建的云原生内容和资产管理系统、内容分发以及直播流平台,它将基于云的资产管理系统与 AWS Media Services 以及人工智能/生成式人工智能的强大功能完美融合,形成一个统一且易于使用的系统。

“Amazon S3 Vectors 使我们能够以高效且经济的方式扩展媒体搜索功能,使其能够处理数十亿条记录,以满足客户不断扩大的内容库需求。”

Nomad Media 的联合创始人兼首席执行官 Adam Miller

Missing alt text value