Amazon SageMaker Canvas – Features

Erstellung hochpräziser ML-Modelle über eine visuelle Schnittstelle, kein Code erforderlich

Chat-gesteuerte ML-Entwicklung mit Amazon Q Developer

Amazon Q Developer hilft, die Lücke zwischen geschäftlichen Herausforderungen und ML-Modellen zu schließen. Es übersetzt Geschäftsprobleme fachmännisch in schrittweise ML-Workflows und erklärt ML-Begriffe in einer nicht-technischen Sprache.

Amazon Q Developer führt Benutzer fachkundig durch jeden Schritt der Modellentwicklung, von der Vorbereitung der Daten bis hin zur Erstellung, Schulung und Bereitstellung von ML-Modellen. Über eine Chat-Schnittstelle bietet Amazon Q Developer kontextbezogene Unterstützung und hilft Benutzern bei der Navigation durch den gesamten ML-Workflow, um produktionsreife ML-Modelle zu erstellen.

Der deterministische Pipeline-Builder von Amazon Q Developer und die fortschrittlichen AutoML-Techniken unterstützen die Reproduzierbarkeit und Genauigkeit bei der Modellerstellung. Durch die Bereitstellung fortschrittlicher Funktionen der Datenwissenschaft für Benutzer ermöglicht Q Developer schnelle Experimente, während das Vertrauen in die Nützlichkeit des Modells erhalten bleibt.

Amazon Q Developer verwaltet Artefakte wie ursprüngliche und transformierte Datensätze sowie die Datenaufbereitungs-Pipelines, die in natürlicher Sprache erstellt wurden. Darüber hinaus können mit Q Developer erstellte Modelle in der SageMaker-Modellregistrierung registriert werden und Modellnotizbücher können zur weiteren Anpassung und Integration exportiert werden.

Daten vorbereiten

SageMaker Canvas kann mit mehr als 50 Datenquellen verbunden werden oder Sie können lokale Dateien hochladen, um Ihr ML-Modell zu trainieren. Tabellen-, Bild- oder Textdaten werden unterstützt. Sie können auch Abfragen schreiben, um mit SQL auf Datenquellen zuzugreifen, und Daten direkt in verschiedenen Dateiformaten wie CSV, Parquet, ORC und JSON sowie in Datenbanktabellen importieren.
Über die codefreie Oberfläche von SageMaker Canvas können Sie Daten mithilfe integrierter oder benutzerdefinierter Visualisierungen untersuchen, visualisieren und analysieren. Mit einem einzigen Klick können Sie den Datenqualitäts- und Inspektionsbericht erstellen, um die Datenqualität zu überprüfen, z. B. um sicherzustellen, dass der Datensatz keine fehlenden Werte oder doppelten Zeilen enthält, und um Anomalien wie Ausreißer, Klassenungleichgewichte und Datenverluste zu erkennen.
SageMaker Canvas bietet eine Auswahl von über 300 vorgefertigten, PySpark-basierten Datentransformationen, so dass Sie Ihre Daten transformieren können, ohne eine einzige Zeile Code schreiben zu müssen. Alternativ können Sie auch die vom Basismodell gesteuerte Chat-Schnittstelle verwenden, um Ihre Daten aufzubereiten.
SageMaker Canvas macht es einfach, einen Datenaufbereitungs-Workflow zu starten oder zu planen, um Ihre Daten schnell zu verarbeiten und die Datenaufbereitung über Datensätze hinweg zu skalieren, sie in ein SageMaker Studio-Notizbuch zu exportieren oder in SageMaker Pipelines zu integrieren.

Zugriff und Erstellung von ML-Modellen

Über die No-Code-Schnittstelle von SageMaker Canvas können Sie mithilfe Ihrer Unternehmensdaten automatisch benutzerdefinierte ML-Modelle erstellen. Sobald Sie Ihre Daten ausgewählt und aufbereitet haben und wissen, was Sie vorhersagen möchten, identifiziert SageMaker Canvas den Problemtyp, testet Hunderte von ML-Modellen auf der Grundlage des Problemtyps (unter Verwendung von ML-Techniken wie linearer Regression, logistischer Regression, Deep Learning, Zeitreihenprognose und Gradient Boosting) und erstellt ein benutzerdefiniertes Modell, das auf der Grundlage Ihres Datensatzes die genauesten Vorhersagen macht. Alternativ können Sie Ihr eigenes, zuvor erstelltes Modell auf SageMaker Canvas übertragen und das Modell für die Inferenz bereitstellen.

SageMaker Canvas bietet Zugriff auf fertige tabellarische, NLP- und CV-Modelle für Anwendungsfälle wie Stimmungsanalyse, Objekterkennung in Bildern, Texterkennung in Bildern und Entitätsextraktion. Gebrauchsfertige Modelle werden von AWS-KI-Services zur Verfügung gestellt, wie z. B. Amazon Rekognition, Amazon Textract und Amazon Comprehend.

Nachdem Sie Ihr Modell erstellt haben, können Sie anhand von Unternehmensdaten bewerten, wie gut Ihr Modell funktioniert, bevor Sie es in der Produktion einsetzen. Sie können die Modellantworten einfach vergleichen und die beste Antwort für Ihre Bedürfnisse auswählen.

SageMaker Canvas bietet Zugriff auf einsatzbereite Basismodelle (FMs) für die Inhaltserstellung, Textextraktion und Textzusammenfassung. Sie können auf FMs wie Claude 2, Llama-2, Amazon Titan, Jurassic-2 und Command (unterstützt von Amazon Bedrock) sowie auf öffentlich verfügbare FMs wie Falcon, Flan-T5, Mistral, Dolly und MPT (unterstützt von SageMaker JumpStart) zugreifen und diese mithilfe Ihrer eigenen Daten optimieren.

Generierung von ML-Vorhersagen

SageMaker Canvas bietet eine visuelle Was-wäre-wenn-Analyse, so dass Sie die Modelleingaben ändern und anschließend nachvollziehen können, wie sich die Änderungen auf einzelne Vorhersagen auswirken. Sie können automatische Stapelvorhersagen für einen gesamten Datensatz erstellen. Wird der Datensatz aktualisiert, wird Ihr ML-Modell automatisch aktualisiert. Nachdem das ML-Modell aktualisiert wurde, können Sie die aktualisierten Vorhersagen über die codefreie Schnittstelle von SageMaker Canvas überprüfen.

Sie können Ihr SageMaker-Canvas-Modell für Echtzeit-Inferenzen auf SageMaker-Endpunkten bereitstellen.

Teilen Sie Modellvorhersagen mit Amazon QuickSight, um Dashboards zu erstellen, die traditionelle Business Intelligence und prädiktive Daten in derselben interaktiven Grafik kombinieren. Darüber hinaus können SageMaker-Canvas-Modelle gemeinsam genutzt und direkt in QuickSight integriert werden, so dass Analysten hochpräzise Vorhersagen für neue Daten innerhalb eines QuickSight-Dashboards erstellen können.

Nutzen von MLOps

Sie können in SageMaker Canvas erstellte ML-Modelle mit einem einzigen Klick in der SageMaker Model Registry registrieren, um das Modell in bestehende CI/CD-Prozesse zur Modellbereitstellung zu integrieren.

Sie können Ihre SageMaker-Canvas-Modelle mit Datenwissenschaftlern teilen, die SageMaker Studio verwenden. Anschließend können Datenwissenschaftler aktualisierte Modelle überprüfen, aktualisieren und mit Ihnen teilen oder Ihr Modell zur Inferenz einsetzen.