Amazon S3 Metadata(预览版)

利用近实时的对象元数据加速数据发现

在 S3 中查找和整理所需的数据

Amazon S3 Metadata(预览版)通过使对象元数据易于访问和查询,充分发挥 S3 数据的全部潜力。显示、存储和查询存储在 S3 中的对象的丰富元数据,以便快速查找业务分析、实时推理应用程序等所需的数据。S3 Metadata 支持对象元数据,其中包括系统定义的详细信息(例如对象的大小和来源)和自定义元数据,它允许您使用标签为对象添加商品 SKU、事务 ID、内容评级等信息作为注释。 阅读博客了解更多信息

优势

从 S3 中的数万亿个对象中快速查找和检索所需的数据。

使用标签,以用业务特定的元数据对您的对象进行注释,从而改善数据逻辑性和可搜索性。

该功能旨在通过对 Apache Iceberg 的内置支持,自动捕获和组织在托管式 S3 Tables 中的对象元数据。

通过 S3 Tables(预览版)与 AWS Glue Data Catalog 的集成,使用常用的 AWS 服务(如 Amazon Athena、Redshift、EMR 和 QuickSight)分析元数据。S3 Metadata 与常用的开源工具兼容。

使用案例

使用丰富的元数据对存储的数据进行编目,便于发现和利用。

跟踪和管理人工智能生成的视频,包括其来源、创建时间以及 Amazon Bedrock 使用的人工智能模型。

分析对象元数据,以确定可节省成本和提高性能的机会。

快速识别和分析用于商业智能和决策的相关数据集。

使用自定义元数据注释,以改进数据组织性和合规性。

客户

  • Cambridge Mobile Telematics

    Cambridge Mobile Telematics(CMT)是全球最大的远程信息处理服务提供商。它的使命是确保全世界的道路和驾驶员更为安全。该公司的人工智能驱动平台 DriveWell Fusion® 从数百万台物联网设备(包括智能手机、专有标签、联网汽车、行车记录仪和第三方设备)收集传感器数据,并将这些数据与上下文数据融合在一起,以创建车辆和驾驶员行为的统一视图。

    在 CMT,我们存储并分析来自全球移动物联网设备的多 PB 数据,以提高驾驶员安全和道路行驶安全。随着业务扩展,查找特定数据以开发新的见解和模型变得越来越具有挑战性。S3 Metadata,尤其是其自定义元数据功能,让我们能够对所有数据进行注释,并在可查询的托管表中维护元数据。现在,查找相关数据只需要一个高效且经济的 SQL 查询。这使得 S3 Metadata 成为变革的关键,让我们能够为客户提供新功能。

    Cambridge Mobile Telematics 首席信息官 Tim Vogel
  • PayPal

    PayPal 一直在力争为全球商业带来变革,至今已超过 25 年。PayPal 通过带来创新体验,使资金流动、销售和购物变得简单、个性且安全,帮助约 200 个市场的消费者和企业加入全球经济并实现蓬勃发展。

    S3 Metadata 为我们提供一种简单、直接的机制,可使用 Amazon Athena 和 Amazon QuickSight 等标准工具分析数万亿个 S3 对象。借助此功能,我们可以将时间花在决策上,而不是构建复杂的数据管道以访问和查询 S3 对象元数据。

    PayPal 大型企业平台工程副总裁 Jon Southall
  • Roche

    Roche 是一家生物技术公司,将药物和诊断相结合,以实现个性化医疗进步并改善人们的生活。

    S3 Metadata 加速我们的生成式人工智能计划。当我们为团队构建 LLM 应用程序(例如内部聊天机器人)时,PDF 等非结构化数据会变得越来越有价值。我们需要将大量特定领域的文档输入到检索增强生成(RAG)应用程序中,以便聊天机器人能够适应 Roche 的特定业务环境。然而,这也意味着我们需要管理的非结构化数据会越来越多。我们需要元数据系统来有效描述我们的非结构化数据,以便我们的用户能够快速筛选我们的大型数据湖,为他们正在构建的特定生成式人工智能应用识别相关数据集。借助 S3 Metadata,构建功能强大的元数据系统变得非常简单,只需在 AWS 管理控制台中点击几下即可。随着我们不断摄取更多的非结构化数据,S3 Metadata 会自动显示元数据并保持元数据处于最新状态。我们还使用自己的 Lambda 来提取特定业务的元数据,例如根据与 Roche 相关的分类标准对文档进行分类,并将这些元数据与 S3 Metadata 表一起存储在同一个粘合目录中,这样只需简单的 SQL 连接,我们就能获得所需的所有元数据。S3 Metadata 可以帮助我们更快地构建生成式人工智能应用,从而使我们能够专注于构建而不是组织数据。

    Roche 制药商业工程负责人 Yannick Misteli
  • SmugMug / Flickr

    SmugMug 和 Flickr 为摄影师提供上传和共享照片和视频的在线平台。该公司在其应用程序中存储了数十亿张照片和视频。

    想象一下驾驶时光机器探索您的 Amazon S3 数据。在 SmugMug 和 Flickr,我们在 S3 中存储了超过 22 年的客户照片,对象数量达数千亿。新的 S3 Metadata 功能帮助我们以较低的价格轻松探索我们的 S3 对象元数据,通过查询对象大小等元数据来了解我们的数据是如何演变的,这在以前需要将昂贵的数据库查询与对象清单结合起来。了解摄影师如何使用我们的存储,有助于进一步履行我们通过摄影的力量建设更美好世界的承诺。

    SmugMug 首席工程师 Andrew Shieh
  • Solink 为各种规模的企业提供值得信赖的云视频安全系统。其硬件和软件有助于为 40 多个国家/地区数万个地点的 IT、防损、运营和安全团队提供可见性。

    Solink 每月处理超过 5 亿小时的视频,将安全录像与 350 多个来源的关键业务数据进行集成。AWS 支持我们所依赖的基础设施,而 Amazon S3 Metadata 将进一步提供实时见解,以加强我们的内容管理,包括监控存储和使用情况以及跟踪客户配置更改的实时效果。

    Solink 首席技术官 Martin Soukup
  • Commvault

    Commvault 是网络弹性的黄金标准,帮助超 10 万个组织确保数据安全和业务恢复能力,并不断向前发展。如今,Commvault 提供唯一一个集最佳数据安全性和企业级快速恢复于一体的网络弹性平台,可随时随地以最低的总体拥有成本在任何工作负载上进行快速恢复。

    Amazon S3 已成为各种数据类型的领先云存储提供商。Amazon S3 元数据将确保 Commvault 等供应商能够主动帮助识别和保护敏感信息,同时还有助于自动化数据分层等元素,并改善我们共享客户的成果。S3 Metadata 可促进高效的数据组织,有助于简化数据发现,能够对对象进行详细标注,这对于云优先的网络弹性至关重要。

    Commvault 首席技术和人工智能官 Pranay Ahlawat
  • New Relic

    全新的 Relic 智能可观测性平台为客户提供软件环境各个部分的深入性能分析。客户可以轻松查看和分析海量数据,并实时获得切实可行的见解。

    New Relic 是可观测性领域的领导者,其数据引擎每天处理大约 1.3 EB 的 Amazon S3 数据。S3 Metadata 将通过自动生成丰富的对象元数据加速我们的创新,从而简化我们团队运行产品实验和构建概念验证(如开发有益于客户的新指标)所需的数据探索。S3 Metadata 将减少我们构建和维护强大元数据系统的工作量,从数百小时减少到只需在 S3 管理控制台点击几下,使我们的工程师能够专注于数据分析而不是数据组织。

    New Relic 首席技术官 Siva Padisetty