AWS Glue Data Quality

Hochwertige Daten über Ihre Data Lakes und Pipelines liefern

Warum AWS Glue Data Quality?

Data Lakes können ohne angemessene Aufsicht zu Datensümpfen werden. Die Einrichtung von Datenqualitätsprüfungen ist zeitaufwändig, mühsam und fehleranfällig. Sie müssen Datenqualitätsregeln manuell erstellen und Code schreiben, um Datenpipelines zu überwachen und Datenverbraucher zu benachrichtigen, wenn sich die Datenqualität verschlechtert. AWS Glue Data Quality reduziert diesen manuellen Qualitätsaufwand von Tagen auf Stunden. Es berechnet automatisch Statistiken, empfiehlt Qualitätsregeln, überwacht und warnt Sie, wenn Probleme erkannt werden. Für versteckte und schwer zu findende Probleme verwendet Glue-Data-Quality-ML-Algorithmen. Die Kombination aus regelbasiertem und ML-Ansatz sowie der serverlosen, skalierbaren und offenen Lösung ermöglicht es Ihnen, qualitativ hochwertige Daten bereitzustellen, um fundierte Geschäftsentscheidungen zu treffen. 

Funktionen von AWS Glue Data Quality