投稿日: Aug 9, 2019

一致するレコードを特定するカスタム機械学習変換である、新しい FindMatches ML 変換を使用して、AWS Glue でデータセット (識別子のないものを含む) 全体から、一致するレコードを検索できるようになりました。FindMatches 変換を Glue ETL ジョブに追加することにより、関連する製品、場所、サプライヤー、顧客などを見つけることができます。

また、FindMatches 変換を使用して、重複排除を行うこともできます。例えば、複数回サインアップした顧客や、誤って製品カタログに複数回追加された製品などを特定できます。FindMatches ML 変換に、例を使用して「重複」の定義を教えておくことで、機械学習を使用してデータセット内の重複している可能性があるレコードを特定できます。

AWS Glue ML 変換は、まず米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (アイルランド)、アジアパシフィック (東京) の AWS リージョンでご利用いただけます。

この機能の詳細については、ドキュメントをご覧ください。