投稿日: Dec 20, 2022

組織全体のデータのカタログ化、検索、共有、ガバナンスを可能にする新たなデータ管理サービス Fox Corporation などが導入

※本プレスリリースは、現地時間 2022 年 11 月 29 日に米国で発表されたプレスリリースの抄訳版です。

(ラスベガス、2022 年 11 月 29 日発表)Amazon.com, Inc.(NASDAQ: AMZN)の関連会社である Amazon Web Services, Inc.(AWS)は 11 月 29 日、AWS re:Invent において、新たなデータ管理サービスである Amazon DataZone を発表しました。同サービスは、AWS、オンプレミス、サードパーティーのソースに保存されているデータのカタログ化、検索、共有、ガバナンスをより迅速かつ容易に実行できる新たなデータ管理サービスです。組織のデータ資産を監督するアドミニストレーターやデータスチュワードは、 Amazon DataZone を活用することでデータアクセスをきめ細かく制御し、適切なレベルの権限と適切なコンテキストによるアクセスを確保することで、データの管理、ガバナンスを実施することができます。またエンジニア、データサイエンティスト、プロダクトマネージャー、アナリスト、ビジネスユーザーは組織内のあらゆるデータにアクセスし、データを検索、活用し、協力してデータからインサイトを引き出すことができます。詳しくは、以下のウェブサイトをご確認ください。
aws.amazon.com/datazone  

現代の組織は、複数の部署、サービス、オンプレミスのデータベース、サードパーティーのソース(パートナーソリューションや一般公開されているデータセットなど)に分散するペタバイト、あるいはエクサバイト規模のデータを収集しています。このデータの価値を最大限に活用するためには、データを創出、管理するアドミニストレーターやデータスチュワード(データプロデューサー)が適切なアクセス権限を持ち、適切なアクセス権限を持つ人物が適切なコンテクストでデータにアクセスできるよう制御、ガバナンスを徹底する必要があります。一方で、社員(データの消費者(コンシューマー))は、データプロデューサーからの情報を発見、分析し、意思決定に活かしたいと考えています。データの安全性を維持するための制御ニーズと、新たなインサイトを得るためにデータにアクセスするニーズにバランスよく対応することが求められますが、組織全体の多様なデータ、部署、ユースケースを加味したガバナンスポリシーを実施するのは容易ではありません。カタログを構築して情報を整理している企業もありますが、このようなシステムは維持に時間を要し、データを検索可能にするためには、データプロデューサーが手動で各データセットにコンテキスト(発信元、概要など)を付与する必要があり、ガバナンスをシンプルに行うためのアクセス制御が内蔵されていません。また、一貫したデータ分類を適用するのが難しく、各データプロデューサーが自分の情報を同期させる必要があり、組織全体でデータを検索するのが困難となり、情報の陳腐化につながる可能性があります。データ消費者が必要な情報を見つけられたとしても、カタログからオーナーに直接アクセスを要求したり、データを分析サービスに取り込んだり、コラボレーションに活用するのは容易ではありません。このため、意思決定者は必要な情報を速やかに入手できず、不完全なデータ、古いデータを元に不十分な判断を下すことになる可能性があります。

新たなデータ管理サービス Amazon DataZone により、データプロデューサーはより簡単にデータアクセスの管理、統制ができ、データ消費者はデータを発見、活用し、協力してデータからビジネスインサイトを引き出すことができます。データプロデューサーは Amazon DataZone のウェブポータルを利用して、データ分類の定義、ガバナンスポリシーの設定、様々な AWS サービス(Amazon Simple Storage Service、Amazon Redshift など)やパートナーソリューション(Salesforce、ServiceNow など)、オンプレミスシステムとの連携により、各自のビジネスデータカタログを設定します。Amazon DataZone は、各データセットに機械学習を使ってメタデータ(発信元、データ型など)を収集・提案し、顧客のタクソノミーやプリファレンス上でトレーニングを行い徐々に改善することで、カタログ維持の手間を取り除きます。カタログがセットアップされると、データ消費者は Amazon DataZone のウェブポータルを利用してデータ資産の検索、発見、メタデータのコンテキストの検証、データセットへのアクセス要求ができるようになります。データ消費者はデータ分析を開始できる状態になると、データプロジェクトを作成します。これはウェブポータル上の共有スペースで、ユーザーは様々なデータセットを取り込み、他の社員とアクセスを共有し、連携して分析を実施することができます。Amazon DataZone は Amazon Redshift、Amazon Athena、Amazon QuickSight など AWS のアナリティクスサービスと連携しており、データ消費者はこれらのサービスに自身のデータプロジェクトのコンテキストでアクセスすることができ、別途ログインクレデンシャルを管理しなくても、データは自動的にこれらのサービスで利用可能となります。また Amazon DataZone では、API(アプリケーションプログラミングインターフェース)が提供され、カスタムのソリューションや DataBricks、Snowflake、Tableau といったパートナーソリューションと連携でき、あらゆるデータ資産を容易に公開し、検索し、活用することができます。

AWS のデータベース、アナリティクスおよび機械学習担当バイスプレジデントであるスワミ・シヴァスブラマニアン(Swami Sivasubramanian)は、次のように述べています。「データを組織全体でアクセス可能にするためには優れたガバナンスが基本となりますが、お客様からは、データを発見しやすくすることとガバナンスを維持することのバランスをとるのが難しいという声をお客様からよく耳にします。Amazon DataZone は、強力なガバナンスと容易なアクセスを単一のサービスで両立しており、容易にデータを特定、整理し、コラボレーションすることができます。Amazon DataZone により、組織全体でデータを活用できるようになるため、全社員が新たなインサイトを導き出し、その価値を最大化することに貢献できます」

Fox Corporation は、スポーツ、ニュース、エンターテインメントのコンテンツを制作、配信する大手企業です。Fox Corporation のデータ基盤担当バイスプレジデントである Alex Tverdohleb 氏は、次のように述べています。「当社では、事業全体でデータを統合し、安全かつ大規模にデータにアクセスし、検索、公開、共有できる信頼性の高い環境を構築することが不可欠です。各事業部門が踏み込んだ技術的作業を必要とせず、安全にデータを発見して共有できるようにしたいのです。Amazon DataZone により、適切なガバナンスを維持しながらデータの検索、共有を簡素化、自動化し、必要な時に適切なツールからのアクセスを可能にすることができます」