Amazon Web Services ブログ

AWS Clean Rooms が複数のクラウドとデータソースをサポートするようになりました

12 月 1 日、AWS Clean Rooms のデータコラボレーションの新しいソースとして Snowflake と Amazon Athena のサポートを発表しました。AWS Clean Rooms を使用すると、お客様とパートナーが互いの基礎データを共有したりコピーしたりすることなく、集合データセットをよりシームレスかつ安全に分析できます。この機能強化により、ソースデータを移動したり公開したりすることなく、Snowflake に保存されているデータセット、または AWS Lake Formation アクセス許可や AWS Glue データカタログビューなどの Athena 機能を使用してクエリ可能なデータセットを操作できます。

研究開発、投資、マーケティングや広告キャンペーンのためのインサイトを得るには、多くの場合、パートナーと協力してデータセットを分析する必要があります。パートナーのデータセットが Amazon Simple Storage Service (Amazon S3) の外部に保存または管理されている場合があり、企業はデータの移動やコピーにまつわる複雑さ、コスト、コンプライアンスリスク、遅延を軽減または排除したいと考えています。企業はまた、データをコピーすると古い情報が使用され、得られるインサイトの質が低下する可能性があることにも気付きました。

今回の発表は、企業が抽出、変換、ロード (ゼロ ETL) で、AWS Clean Rooms コラボレーションで最新の集合データセットを共同作業するのに役立ちます。これにより、既存の環境からのデータセットの移行に伴うコストと複雑さが解消されます。例えば、Amazon S3 にデータを保存している広告主と、Snowflake に保存されているデータを持つメディアパブリッシャーは、ETL データパイプラインを構築したり、基礎となるデータを互いに共有したりしなくても、オーディエンスの重複分析を実行して、集合データセットに存在するユーザーの割合を判断できます。コラボレーションプロセス中、外部データソースからの基礎データが AWS Clean Rooms に永続的に保存されることはなく、AWS Clean Rooms 分析環境に一時的に読み込まれたデータは、クエリの完了時に削除されます。データの保存場所に関係なくパートナーと連携できるようになり、インサイトを生成するプロセスが合理化されます。

この機能の使い方をお見せしましょう。

AWS Clean Rooms で複数のクラウドとデータソースを使用する方法
この機能を説明するために、広告主である A 社とパブリッシャーである B 社の間のシナリオを使用します。A 社は、広告キャンペーンを実施する前に、B 社のウェブサイトで価値の高いユーザーのうち何人にリーチできるかを知りたいと考えています。A 社は自社のデータを Amazon S3 に保存しています。B 社はデータを Snowflake に保存しています。AWS Clean Rooms を使用するには、両当事者がそれぞれ独自の AWS アカウントを持っている必要があります。

このデモでは、広告主である A 社がコラボレーションの作成者です。A 社は AWS Clean Rooms コラボレーションを作成し、Snowflake でデータをホストしている B 社をコラボレーションに招待します。AWS Clean Rooms の一般提供開始のお知らせブログ記事を読むと、具体的な手順に従ってコラボレーションを作成できます。

次に、パブリッシャーの B 社が AWS Clean Rooms で設定済みのテーブルを作成し、データソースとして Snowflake を指定し、Secrets Manager の Amazon リソースネーム (ARN) を指定する方法を示します。AWS Secrets Manager は、ライフサイクル全体にわたってデータベース認証情報などのシークレットを管理、取得、更新するのに役立ちます。シークレットには、コラボレーションしたいデータへの読み取り専用許可を持つ Snowflake ユーザーの認証情報が含まれている必要があります。AWS Clean Rooms はこれを使用してシークレットを読み取り、Snowflake に保存されているデータにアクセスします。シークレットを作成するステップバイステップの手順については、Secrets Manager のドキュメントを参照してください。

B 社の AWS アカウントを使用して、AWS Clean Rooms コンソールに移動し、[Configured resources] (設定済みリソース) で [Tables] (テーブル) を選択します。[Configure new table] (新しいテーブルを設定) を選択します。[Third-party clouds and data sources] (サードパーティーのクラウドとデータソース) で [Snowflake] を選択します。コラボレーションしたい Snowflake に保存されているデータセットへの読み取りアクセス権を持つロールの Snowflake 認証情報を含むシークレットのシークレット ARN を入力します。これらは、Snowflake テーブルとスキーマにアクセスしようとしているエンティティの身元を確認するために使用する認証情報です。シークレット ARN がない場合は、[Store a new secret for this table] (このテーブルに新しいシークレットを保存) オプションを使用して新しいシークレットを作成できます。

ーブルとスキーマの詳細を定義するには、[Import from file] (ファイルからインポート) オプションを使用し、Snowflake からエクスポートした列表示情報スキーマ CSV ファイルを選択すると情報が入力されます。情報を手動で入力することもできます。

このデモでは、[Columns allowed in collaborations] (コラボレーションで許可された列) にある [All columns] (すべての列) を選択します。次に、[Configure new table] (新しいテーブルを設定) を選択します。

設定したテーブルに移動して、クエリの作成を許可されている AWS アカウントやクエリに使用できる列など、テーブルの詳細を確認します。このページでは、テーブル名、説明、分析ルールを編集できます。

AWS Clean Rooms でコラボレーション分析に使用するテーブルの設定の一環として、分析ルールを設定する必要があります。分析ルールは、各データ所有者が設定済みテーブルに設定するプライバシーを強化するコントロールです。分析ルールは、設定済みテーブルをどのように分析できるかを決定します。[Configure analysis rule] (分析ルールを設定) を選択して、設定済みテーブルでカスタムクエリを実行できるカスタム分析ルールを設定します。

ステップ 1 では、選択を進めていきます。JSON エディタを使用して、JSON 形式の分析ルール定義を作成、貼り付け、またはインポートできます。[Next] (次へ) を選択します。

ステップ 2 では、[Analyses for direct querying] (ダイレクトクエリの分析) で、[Allow any queries created by specific collaborators to run without review on this table] (特定の共同作業者が作成したすべてのクエリをこのテーブルでレビューなしで実行できるようにする ) を選択します。このオプションでは、許可されたアカウントのリストで指定した AWS アカウントが提供したクエリのみをテーブルで実行できます。許可されたアカウントによって作成されたすべての分析テンプレートは、レビューを必要とせずに自動的にこのテーブルで実行できます。[AWS account ID] (AWS アカウント ID) で許可されたアカウントを選択し、[Next] (次へ) を選択します。

ステップ 3 では、選択を進めていきます。クエリ出力にすべての列が表示されるように、[Columns not allowed in output] (出力では列が許可されていません) で [None] (なし) を選択します。[Additional analyses applied to output] (追加分析が出力に適用されました) で [Not allowed] (許可されていません) を選択して、このテーブルで追加解析を実行できなくします。[Next] (次へ) を選択します。

最後のステップでは、設定を確認して [Configure analysis rule] (分析ルールを設定) を選択します。

次に、このテーブルを [Associate to Collaboration] (コラボレーションに関連付ける) を使用して作成した広告主であるコラボレーションの A 社に関連付けます。

ポップアップウィンドウで、アクティブなメンバーシップを持つコラボレーションからコラボレーションを選択し、[Choose collaboration] (コラボレーションを選ぶ) を選択します。

次のページで、[Configured table name] (設定済みのテーブル名) を選択し、[Table associations details] (テーブルの関連付けの詳細) に名前を入力します。AWS Clean Rooms がテーブルをクエリする許可を付与する方法を選択します。[Associate table] (テーブルを関連付ける) 選択します。

広告主である A 社とパブリッシャーである B 社は、オーディエンス重複分析を実行して、互いの未加工データにアクセスすることなく、集合データセットに存在するユーザーの割合を判断できるようになりました。この分析は、パブリッシャーが広告主のオーディエンスにどの程度リーチできるかを判断するのに役立ちます。重複を評価することで、広告主はパブリッシャーが独自のリーチを提供しているのか、それともパブリッシャーのオーディエンスが広告主の既存のオーディエンスと主に重複しているのかを判断できます。どちらの当事者もソースデータを移動したり共有したりする必要はありません。A 社のアカウントに切り替えて、AWS Clean Rooms コンソールに移動します。作成したコラボレーションを選択し、次のクエリを実行してオーディエンスの重複分析結果を取得します。

select count (distinct emailaddress)
from customer_data_example as advertiser
inner join synthetic_customer_data  as publisher
on 'emailaddress' = 'publisher_hashed_email_address'

この例では、Snowflake をデータソースとして使用しました。AWS Lake Formation の許可に従い、Athena を使用してこのデータに対してクエリを実行することもできます。これにより、Lake Formation のきめ細かいアクセス制御で行レベルと列レベルのフィルタリングを行い、データセットをコラボレーションに関連付ける前に AWS Glue データカタログビューを使用してデータを変換できます。

お客様とパートナーの声
「世界初の旅行者向けメディアネットワークである Kinective Media by United Airlines での業務には、データセキュリティとプライバシーが不可欠です」と、Kinective Media by United Airlines の Strategic Partnerships 部門 Director の Khatidja Ajania 氏は言います。「AWS Clean Rooms は複数のクラウドと AWS ソースのソースデータをサポートしているため、より多くのブランドと安全かつシームレスに連携して、クローズドループ測定やその他の主要なユースケースを実現できます。この強化により、プライバシーが強化された広告主やパートナーとのコラボレーションを通じて、パーソナライズされたエクスペリエンス、コンテンツ、関連サービスを何百万人もの United の旅行者に安全に提供できるようになります」。

「Snowflake では、データクリーンルームテクノロジーを使用する際に、テクノロジースタック間のソースデータの相互運用性に課題があることを認識しています。ユーザーが選択したソリューションを通じて、安全かつ効果的にデータパートナーシップの可能性を最大限に引き出せるようにするという共通の目標に向けた進展と新たな一歩を踏み出したことを嬉しく思います」– Snowflake Data Clean Rooms の General Manager、Kamakshi Sivaramakrishnan 氏

今すぐご利用いただけます
AWS Clean Rooms のデータソースとして Snowflake と Athena がサポートされることは、クロスクラウドコラボレーションに大きなメリットをもたらします。今回の発表により、クラウドやデータソース間でのデータ移動が不要になり、コラボレーションプロセスが簡素化されます。これは、データの保存場所に関係なく、機密情報を保護しながら、お客様があらゆるパートナーと安全に連携できる方法を拡大するための取り組みの第一歩です。

AWS Clean Rooms を今すぐ始めましょう。複数のデータソースとのコラボレーションの詳細については、AWS Clean Rooms のドキュメントをご覧ください。

– Esra

原文はこちらです。