Publié le: Aug 9, 2019
Vous pouvez maintenant utiliser AWS Glue pour rechercher des enregistrements correspondants dans un ensemble de données (y compris ceux sans identifiants) en utilisant le nouveau FindMatches ML Transform, une transformation de machine learning personnalisée qui vous aide à identifier les enregistrements correspondants. En ajoutant la transformation FindMatches à vos travaux Glue ETL, vous pouvez rechercher des produits, des lieux, des fournisseurs et des clients reliés, et bien plus.
Vous pouvez également utiliser la transformation FindMatches pour la déduplication, par exemple pour identifier les clients qui se sont abonnés plusieurs fois, les produits ajoutés accidentellement à votre catalogue de produits plusieurs fois, etc. Vous pouvez informer la transformation ML FindMatches de votre définition de « doublon » à l'aide d'exemples, et elle utilisera le machine learning pour identifier d'autres doublons potentiels dans votre jeu de données.
AWS Glue ML Transforms sera initialement disponible dans les régions AWS USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon), UE (Irlande) et Asie-Pacifique (Tokyo).
Pour en savoir plus sur cette fonctionnalité, consultez notre documentation.