投稿日: Apr 7, 2021

AWS Glue が不完全なデータセットでの不足値補完を提供するようになりました。不足値補完の変換を使用すると、データの列における空白エントリの予測値を取得できます。この機能では、Null や空の値を含むデータセットのクリーニングを簡単に行うことができるので、これらの値はクエリ時に考慮されなくなります。

不足値補完は、データセットの完全な行からパターンを学習し、ユーザーが指定した列の不足値の値を予測する AWS Glue の新しい ML 変換です。この AWS Glue の機能は、タブ形式のデータセットのカテゴリデータと数値データの両方で使用することができ、従来の方法と機械学習を組み合わせて完全な列が生成されてデータセットに追加されます。不足値補完の使用を開始するための最も簡単な方法は、AWS Glue Studio の変換のリストから選択することです。

不足値補完の変換は、AWS Glue と同じ AWS リージョンでご利用いただけます。

この機能の詳細については、リファレンスドキュメントおよび AWS Glue Studio のドキュメントを参照してください。