AWS Clean Rooms ML が Parquet ファイル形式のサポートを開始

投稿日: 2025年7月17日

本日より、AWS Clean Rooms では、Parquet ファイル形式のデータを使用したカスタム機械学習モデルのトレーニングがサポートされるようになりました。Parquet は、無料のオープンソースの列指向データストレージ形式であり、データを効率的に圧縮しエンコードして、パフォーマンスを向上させることができます。

AWS Clean Rooms ML カスタムモデリングにより、お客様とパートナーは、機密性の高い知的財産を共有することなく、大規模な集合データセットを使用してカスタム機械学習モデルをトレーニングできます。Parquet ファイル形式で機械学習の入力チャネルを作成すると、大量のデータをより効率的に処理し、テキストベース以外のデータをエンコードできるため、画像やその他のバイナリでエンコードされたデータ型でトレーニングできるようになります。

AWS Clean Rooms ML は、お客様とパートナーがプライバシーを強化するコントロールを適用してお客様独自のデータと ML モデルを保護すると同時に、予測インサイトを生成するのに役立ちます。しかも、お互いに生データやモデルを共有したりコピーしたりする必要はありません。AWS Clean Rooms ML を利用できる AWS リージョンの詳細については、AWS リージョン表をご覧ください。機能の詳細については、AWS Clean Rooms ML をご覧ください。