AWS Clean Rooms が合成データセット生成によるカスタム機械学習トレーニングをサポート
投稿日:
2025年11月30日
AWS Clean Rooms により、お客様とパートナーが、集合データからプライバシーを強化する合成データセットを生成して、リグレッションおよび分類の機械学習モデルをトレーニングできるようになりました。
合成データセットの生成により、トレーニングコードが実際の記録にアクセスしなくても、お客様とパートナーは、元のデータと同様の統計特性を持つトレーニングデータセットを作成できます。この新機能により、元のデータ内の対象 (データの収集対象の個人や団体など) が識別できなくなることで、モデルがトレーニングデータ中の個人に関する情報を記憶するリスクが軽減されます。このため、キャンペーンの最適化、不正検知、医学研究などの、以前はプライバシーの問題で制限されていた新しい機械学習モデルトレーニングのユースケースが可能になります。例えば、独自のアルゴリズムを持つ航空会社が、ホテルブランドと提携して高価格帯の顧客に共同プロモーションを提供したいと考えていますが、どちらの組織も機密の消費者データは共有したくありません。AWS Clean Rooms ML を使用することで、集合データセットの合成バージョンを生成して、生データを公開せずにモデルをトレーニングできます。これにより、顧客のプライバシーを保護しながら、より正確なプロモーションターゲティングを実現できます。
AWS Clean Rooms ML を利用できる AWS リージョンの詳細については、AWS リージョン表をご覧ください。詳細については、AWS Clean Rooms ML をご覧ください。