Publié le: Mar 30, 2022
AWS Glue version 2.0 prend désormais en charge la transformation de machine learning AWS Glue FindMatches. AWS Glue FindMatches automatise le processus d'identification des enregistrements partiellement correspondants pour des cas d'utilisation tels que la liaison d'enregistrements de clients, la déduplication de catalogues de produits et la détection de fraude. Avec Glue 2.0, les tâches ETL qui effectuent la correspondance approximative à l'aide de FindMatches démarrent en moins d'une minute et obéissent à une facturation minimale d'une minute.
Utilisez la transformation FindMatches pour identifier, puis fusionner ou dédupliquer les enregistrements connexes dans vos jeux de données. Par exemple, la transformation peut reconnaître que des enregistrements correspondent malgré des différences d'écriture ou de format, telles que « John Doe » par rapport à « Jhn Doe », « JOHN_DOE@ANYCOMPANY.COM » par rapport à « johndoe@anycompany.com », ou « 555-010-0000 » par rapport à « +1-555-010-0000 ».
Cette fonction est disponible dans les mêmes régions AWS qu'AWS Glue.
Pour en savoir plus, veuillez consulter notre documentation et lire l'article de blog sur FindMatches.