投稿日: Nov 17, 2021

AWS Glue の FindMatches 機械学習の変換に、マッチングスコアを出力するオプションが追加されました。これはレコードの各グループがどれだけマッチしているかを示しています。FindMatches 変換では、レコードに共通の一意の識別子がない場合や完全に一致するフィールドがない場合でも、データセット内の重複レコードまたは一致レコードを識別できます。FindMatches は、複雑なデータのクリーニングや重複排除の作業を自動で行うのに役立ちます。

AWS Glue FindMatches は、顧客レコードのリンク、製品カタログの重複排除、不正検出などのユースケースにおいて、部分的に一致するレコードを特定するプロセスを自動化します。FindMatches のマッチスコアリングを使用して、FindMatches モデルを理解し、満足できるトレーニングが行われているかを判定してマージするレコードを決定します。

この機能は、AWS Glue と同じ AWS リージョンでご利用いただけます。

詳しくは、ドキュメントや FindMatches ブログ記事をご参照ください。