Veröffentlicht am: Sep 8, 2022
Amazon SageMaker Canvas kündigt zusätzliche Funktionen für die explorative Datenanalyse (EDA) mit erweiterten Visualisierungen an, mit denen Sie Ihre Daten besser untersuchen und analysieren können, bevor Sie Modelle für Machine Learning (ML) erstellen. Amazon SageMaker Canvas ist eine visuelle Point-and-Click-Benutzeroberfläche, mit der Geschäftsanalysten selbst genaue ML-Prognosen erstellen können – ohne Erfahrung mit Machine Learning zu haben oder eine einzige Zeile Code schreiben zu müssen.
Ab heute bietet Amazon SageMaker Canvas neue Visualisierungen für EDA, mit denen Sie Ihre Daten vor der Modellerstellung besser verstehen können. Diese Visualisierungen ergänzen die Palette der bereits von Canvas gebotenen Möglichkeiten zur Datenaufbereitung und -exploration, wie z. B. flexible Größen für Datenstichproben, Imputation fehlender Werte, Ersetzen von Ausreißern, Filtern, Verbinden und Ändern von Datensätzen sowie erweiterte Zeitstempelformate. Die Visualisierungen helfen Ihnen, die Beziehungen zwischen den Merkmalen in Ihren Datensätzen zu analysieren und Ihre Daten besser zu verstehen. Dies geschieht in einem leicht lesbaren visuellen Format mit der Möglichkeit, mit den Daten zu interagieren und Erkenntnisse zu gewinnen, die bei Ad-hoc-Abfragen möglicherweise unbemerkt bleiben. Sie können schnell mit dem Data Visualizer in SageMaker Canvas vor der Entwicklung und dem Training von ML-Modellen erstellt werden. Die neuen Visualisierungen umfassen:
- Streudiagramme: Diese Diagramme können verwendet werden, um Beziehungen zwischen verschiedenen numerischen Variablen in Ihren Daten zu beobachten. Punkte werden verwendet, um Werte für zwei verschiedene numerische Variablen darzustellen, wobei die Position jedes Punktes den Wert für einen bestimmten Datenpunkt auf der horizontalen und vertikalen Achse angibt.
- Balkendiagramme: Diese Diagramme können verwendet werden, um eine Reihe von kategorischen Daten zusammenzufassen, die durch Balken dargestellt werden, um einen sofortigen Datenvergleich zu ermöglichen. Die Höhe jedes Balkens stellt die Proportionen einer bestimmten Datenaggregation dar.
- Kastendiagramme: Diese Diagramme stellen Gruppen von numerischen Daten durch ihre Quartile dar. Mit Kastendiagrammen können Sie bestimmen, wie die Werte ihrer Daten verteilt sind. Die grafische Ansicht stellt die Distribution einer oder mehrerer numerischer Datengruppen dar.
Alle EDA-Funktionen, einschließlich der neuen Visualisierungen, werden in allen AWS-Regionen unterstützt, in denen SageMaker Canvas verfügbar ist. Um mehr über Canvas und die unterstützten Regionen zu erfahren und einzusteigen, lesen Sie die Dokumentation von Canvas, besuchen Sie die Produktseite sowie die häufig gestellten Fragen.