Amazon S3 Metadata

ほぼリアルタイムのオブジェクトメタデータでデータ検出を加速

Amazon S3 で必要なデータを検索して整理する

Amazon S3 メタデータは、オブジェクトメタデータに簡単にアクセスしたり、これらのメタデータを簡単にクエリしたりできるようにすることで、Amazon Simple Storage Service (Amazon S3) データの可能性を最大限に引き出します。Amazon S3 に保存されているオブジェクトのリッチなメタデータを表示、保存、クエリすることで、ビジネス分析やリアルタイム推論アプリケーションなどに必要なデータを迅速に見つけることができます。S3 Metadata は、サイズやオブジェクトのソースなどのシステム定義の詳細を含むオブジェクトメタデータと、タグを使用して製品 SKU、トランザクション ID、コンテンツレーティングなどの情報をオブジェクトに注釈できるカスタムメタデータをサポートしています。詳細については、ブログをお読みください。

利点

Amazon S3 内の最大数兆のオブジェクトから必要なデータをすばやく見つけて取得できます。

タグを使用してビジネス固有のメタデータでオブジェクトに注釈を付けると、データの整理と検索能力が向上します。

Apache Iceberg の組み込みサポートにより、マネージド S3 テーブル内のオブジェクトメタデータを自動的にキャプチャして整理するように設計されています。

AWS Glue データカタログとの S3 Tables プレビュー統合を通じて、Amazon Athena、Amazon EMR、Amazon QuickSight、Amazon Redshift などの使い慣れた AWS サービスを使用してメタデータを分析できます。S3 Metadata は一般的なオープンソースツールと互換性があります。

ユースケース

豊富なメタデータを使用して保存されたデータをカタログ化すると、検出と活用が容易になります。

AI によって生成された動画を、そのオリジン、作成時間、Amazon Bedrock で使用されている AI モデルを含めて追跡および管理できます。

オブジェクトメタデータを分析して、コスト削減とパフォーマンス向上の機会を特定します。

ビジネスインテリジェンスと意思決定のための関連データセットを迅速に特定して分析します。

カスタムメタデータの注釈により、データの整理とコンプライアンスを改善します。

お客様

  • Cambridge Mobile Telematics

    Cambridge Mobile Telematics (CMT) は、世界最大のテレマティクスサービスプロバイダーです。その使命は、世界の道路と運転手の安全性を高めることです。同社の AI 駆動型プラットフォームである DriveWell Fusion® は、スマートフォン、独自のタグ、コネクテッドカー、ドライブレコーダー、サードパーティー製デバイスなど、何百万もの IoT デバイスからセンサーデータを収集し、それらをコンテキストデータと融合して、車両と運転手の行動を統一的に把握しています。

    CMT では、世界中のモバイル IoT デバイスからの数ペタバイトのデータを保存および分析して、運転手と道路の安全性を高めています。規模が拡大するにつれて、特定のデータを見つけて新しいインサイトやモデルを開発することがますます困難になっています。S3 Metadata、特にそのカスタムメタデータ機能により、すべてのデータに注釈を付け、クエリ可能なマネージドテーブルでメタデータを管理できます。現在、関連データを見つけるために必要なのは、効率的で費用対効果の高い SQL クエリ 1 つだけです。これにより、S3 Metadata はゲームチェンジャーとなり、お客様に新しい機能を提供できるようになります。

    Cambridge Mobile Telematics、Chief Information Officer、Tim Vogel 氏
  • PayPal

    PayPal は 25 年以上にわたり、世界中の商取引に革命をもたらしてきました。PayPal は、送金、売買、買い物をシンプルに、かつ個人に合わせた安全なものにする革新的な体験を提供しており、約 200 の市場の消費者や企業が世界経済に参加し、成長できるよう支援しています。

    S3 Metadata は、Amazon Athena や Amazon QuickSight などの標準的なツールを使用して何兆もの S3 オブジェクトを分析するためのシンプルでわかりやすいメカニズムを提供してくれます。この機能により、S3 オブジェクトメタデータにアクセスしてクエリするための複雑なデータパイプラインを構築するのに時間をかけるのではなく、意思決定に時間を費やすことができます。

    PayPal、VP Engineering, Large Enterprise Platforms、Jon Southall 氏
  • Roche

    Roche は、医薬品と診断薬を組み合わせて個別化医療の進歩を実現し、人々の生活を改善するバイオテクノロジー企業です。

    S3 Metadata は、生成 AI の取り組みを加速させています。社内チャットボットなどの LLM アプリケーションをチーム向けに構築するにつれて、PDF などの非構造化データの価値が高まっています。チャットボットが Roche の特定のビジネスコンテキストに合わせて調整できるように、大量のドメイン固有のドキュメントを検索拡張生成 (RAG) アプリケーションに取り込む必要があります。ただし、これは、管理する必要のある非構造化データがますます増えていることも意味します。非構造化データを効率的に記述するメタデータシステムが必要です。これにより、ユーザーは大規模なデータレイクをすばやくふるいにかけ、構築している特定の生成 AI アプリケーションに関連するデータセットを特定できます。S3 Metadata を使用すると、AWS マネジメントコンソールで数回クリックするだけで、堅牢なメタデータシステムを簡単に構築できます。より多くの非構造化データを継続的に取り込むと、S3 Metadata は自動的にメタデータを明らかにし、メタデータを最新の状態に保ちます。また、独自の Lambda を使用して、Roche に関連する分類法に基づいて文書を分類するなど、ビジネス固有のメタデータを抽出しています。また、このメタデータを S3 メタデータテーブルと同じ Glue カタログに保存して、シンプルな SQL 結合で必要なすべてのメタデータを取得できるようにしています。S3 Metadata は生成 AI アプリケーションをより迅速に構築するのに役立ちます。これにより、データの整理よりも構築に集中できます。

    Roche、Head of Pharma Commercial Engineering、Yannick Misteli 氏
  • SmugMug / Flickr

    SmugMug と Flickr は、写真家が写真や動画をアップロードして共有できるオンラインプラットフォームを提供します。同社は数十億の写真と動画をアプリケーションに保存しています。

    タイムマシンを飛ばして Amazon S3 データを調べているところを想像してみてください。SmugMug と Flickr では、22 年以上にわたるお客様の写真、つまり数千億ものオブジェクトを S3 に保存してきました。新しい S3 Metadata 機能により、S3 オブジェクトのメタデータを簡単かつ低コストで調べることができるようになりました。オブジェクトサイズなどのメタデータを経時的にクエリして、データがどのように変化したかを把握できます。これは、以前は高価なデータベースクエリをオブジェクトインベントリと組み合わせる必要がありました。写真家がストレージをどのように使用しているかを理解することは、写真の力を通じてより良い世界を構築するという私たちの取り組みをさらに深めるのに役立ちます。

    SmugMug、Principal Engineer、Andrew Shieh 氏
  • Solink は、あらゆる規模の企業に信頼できるクラウドビデオセキュリティシステムを提供しています。そのハードウェアとソフトウェアは、40 か国以上の何万もの拠点の IT、損失防止、運用、およびセキュリティチームを可視化するのに役立ちます。

    Solink は毎月 5 億時間を超える動画を処理し、セキュリティ映像を 350 以上のソースからの重要なビジネスデータと統合しています。AWS は私たちが頼りにしているインフラストラクチャをサポートしており、Amazon S3 Metadata はそれをさらに発展させ、ストレージや使用状況のモニタリングから顧客設定変更のリアルタイムな影響の追跡まで、コンテンツ管理を強化するリアルタイムのインサイトを提供しています。

    Solink、Chief Technical Officer、Martin Soukup 氏
  • Commvault

    Commvault はサイバーレジリエンスのゴールドスタンダードであり、100,000 を超える組織がデータを安全に保ち、企業のレジリエンスを維持して前進できるよう支援しています。現在、Commvault は、あらゆるワークロードにわたって、どこからでも、最小の TCO で、最高のデータセキュリティと迅速な復旧をエンタープライズスケールで組み合わせた唯一のサイバーレジリエンスプラットフォームを提供しています。

    Amazon S3 は、さまざまなデータタイプの大手クラウドストレージプロバイダーとして台頭してきました。Amazon S3 Metadata により、Commvault のようなベンダーは、機密情報の特定と保護を積極的に支援できると同時に、データの階層化などの要素を自動化して、共通のお客様の成果を向上させることができます。S3 Metadata は、効率的なデータ整理を促進し、データ検出の合理化に役立ちます。これにより、クラウドファーストのサイバーレジリエンスに不可欠なオブジェクトの詳細な注釈付けを行えます。

    Commvault、Chief Technology and AI Officer、Pranay Ahlawat 氏
  • New Relic

    New Relic の Intelligent Observability Platform は、ソフトウェア環境のあらゆる部分について詳細なパフォーマンス分析を顧客に提供しています。顧客は膨大な量のデータを簡単に表示して分析し、実用的なインサイトをリアルタイムで得ることができます。

    オブザーバビリティのリーダーである New Relic のデータエンジンは、毎日約 1.3 エクサバイトの Amazon S3 データを処理しています。S3 Metadata は、豊富なオブジェクトメタデータを自動的に生成することでイノベーションを加速します。これにより、製品実験を実施したり、お客様にとって有益な新しいメトリクスの開発など、概念実証を構築するためにチームが必要とするデータ探索が簡単になります。S3 Metadata により、堅牢なメタデータシステムの構築と維持にかかる労力が数百時間かかっていたものが、S3 マネジメントコンソールで数回クリックするだけで済むようになります。これにより、エンジニアはデータの整理ではなくデータ分析に集中できるようになります。

    New Relic、Chief Technology Officer、Siva Padisetty 氏