投稿日: Nov 16, 2021

AWS GlueのFindMatches ML トランスフォームでは、新しく届いたデータを既存のマッチしたデータセットと照合できるようになりました。FindMatches 変換では、レコードに共通の一意の識別子がない場合や完全に一致するフィールドがない場合でも、データセット内の重複レコードまたは一致レコードを識別できます。これにより、データセットのクリーンアップと重複排除をより迅速かつ容易に行うことができます。

AWS Glue FindMatches は、顧客レコードのリンク、製品カタログの重複排除、不正検出などのユースケースにおいて、部分的に一致するレコードを特定するプロセスを自動化します。FindMatches のインクリメンタルマッチングを使用すると、データセットを結合したり、マッチしたデータとマッチしていないデータを混在させたりすることなく、新しいデータを既存のデータにマッチさせることができます。

この機能は、AWS Glue と同じ AWS リージョンでご利用いただけます。

詳しくは、ドキュメントブログ記事をご参照ください。