Allgemeines

F: Was ist Amazon SageMaker Ground Truth?

A: Amazon SageMaker Ground Truth vereinfacht das effiziente und präzise Labeling von Datasets für das Training von Machine Learning-Systemen. SageMaker Ground Truth kann Teile eines Datasets automatisch auf Basis der manuell von Menschen vorgenommenen Labels kennzeichnen. Für das manuelle Labeling haben Sie die Wahl zwischen dem großen Crowdsourcing-Pool der Amazon Mechanical Turk-Workforce mit mehr als 500 000 Kennzeichnern, Ihren eigenen Mitarbeitern oder einem der von Amazon geprüften externen Anbieter auf AWS Marketplace. Dabei verbessert SageMaker Ground Truth die Genauigkeit des menschlichen Labeling durch innovative Algorithmen und Endbenutzer (UX)-Techniken. Das Modell wird im Laufe der Zeit immer besser, denn es lernt beständig aus den von Menschen erstellten Labels, wovon die automatischen Prozesse nur profitieren.

F: Was ist automatisches Daten-Labeling?

A: Automatisches Daten-Labeling bezeichnet die Kennzeichnung von Daten mit Machine Learning-Techniken. Amazon SageMaker Ground Truth wählt zunächst ein zufälliges Datensample aus und sendet dieses zum Labeling an hierfür speziell qualifizierte menschliche Mitarbeiter. Anhand der Ergebnisse wird ein Labeling-Modell trainiert, das zum automatischen Labeling eines weiteren Datensamples verwendet wird. Die Labels werden jedoch erst festgeschrieben, wenn das Modell die Daten mit einer Zuverlässigkeit von mindestens einem sehr hohen Grenzwert kennzeichnen kann. Bei Nichterreichen dieses Grenzwerts werden die Daten an menschliche Kennzeichner gesendet. Aus einem Teil der von Menschen gekennzeichneten Daten wird wiederum ein neues Trainings-Dataset für das Labeling-Modell generiert, mit dem das Modell automatisch neu trainiert wird, um seine Genauigkeit zu verbessern. Dieser Prozess wiederholt sich mit jedem neu gekennzeichneten Rohdatensample. Bei jeder Wiederholung lernt das Modell dazu und wird immer präziser im Labeling der Rohdaten, so dass immer weniger Daten an Menschen gesendet werden müssen.

Verwenden von Amazon SageMaker Ground Truth

F: Warum sollte ich Amazon SageMaker Ground Truth verwenden?

A: Bevor Sie Machine Learning-Modelle erstellen, trainieren und bereitstellen, benötigen Sie Daten. Erfolgreiche Modelle setzen auf qualitativ hochwertigen Trainingsdaten auf, wobei die Erfassung und das Labeling der Trainings-Datasets sehr viel Zeit und Mühe beanspruchen. Für die Erstellung der Trainings-Datasets müssen menschliche Kennzeichner große Mengen an Bildern und anderen Datentypen untersuchen und daraus bestimmte Objekte erkennen und kennzeichnen. Diese Labeling-Aufgaben werden auf mehrere menschliche Mitarbeiter aufgeteilt, was zu einem beträchtlichen Mehraufwand und Kosten führt. Sollten den menschlichen Bearbeitern Fehler unterlaufen, lernt das System auch aus den Fehlinformationen und macht entsprechend ungenaue Aussagen.

Amazon SageMaker Ground Truth löst dieses Problem, indem es ein hoch genaues Daten-Labeling durch in Amazon S3 gespeicherte Daten sowie eine Kombination aus automatisch und von Menschen durchgeführtem Daten-Labeling verwendet.

F: Welches sind die ersten Schritte mit Amazon SageMaker Ground Truth?

A: Amazon SageMaker Ground Truth bietet einen verwalteten Prozess, mit dem Sie einen vollständigen Daten-Labeling-Auftrag in nur wenigen Schritten einrichten können. Wenn Sie mit Amazon SageMaker Ground Truth arbeiten möchten, melden Sie sich bei der AWS Management Console an und navigieren zur SageMaker-Konsole. Dort wählen Sie unter "Ground Truth" Labeling-Aufträge aus. Und schon können Sie Ihren Labeling-Auftrag erstellen. Zunächst geben Sie als Teil des Auftragserstellungsworkflows einen Pointer auf den S3-Bucket ein, der das zu kennzeichnende Dataset enthält. Ground Truth bietet Vorlagen für gängige Labeling-Aufgaben, in denen Sie nur wenige Einstellungen vornehmen und kaum Anweisungen zur Durchführung des Daten-Labeling eingeben müssen. Alternativ können Sie auch eigene Vorlagen erstellen. Zuletzt wählen Sie dann eine der drei angebotenen menschlichen Workforce-Optionen aus: (1) eine öffentliche Crowdsource-Workforce, (2) ein kuratierter Pool aus Anbietern von Daten-Labeling-Services oder (3) Ihre eigenen Mitarbeiter. Ebenso können Sie auch das automatische Daten-Labeling aktivieren.

F: Wie werden meine Trainings-Datasets mit Amazon SageMaker Ground Truth verwaltet?

A: Amazon SageMaker Ground Truth verwaltet Metadaten, zugehörige Labels sowie eine Taxonomie der Labels und Datasets. Zur Abfrage und Verwaltung Ihrer Datasets und Labels können Sie problemlos das AWS SDK über ein SageMaker Notebook oder die Ground Truth-Konsole über die SageMaker-Konsole verwenden. Weitere Informationen zu Amazon SageMaker Ground Truth finden Sie in der Dokumentation.

F: Wie hilft Amazon SageMaker Ground Truth bei der Verbesserung der Genauigkeit meiner Trainings-Datasets?

A: Amazon SageMaker Ground Truth bietet die folgenden Funktionen zur Verbesserung der Genauigkeit des durch Menschen durchgeführten Daten-Labelings:

(a) Anmerkungskonsolidierung: Dadurch wird Fehlern oder tendenziösen Entscheidungen einzelner Mitarbeiter entgegen gewirkt. Jedes Datenobjekt wird mehreren Mitarbeitern zugesendet und deren Antworten (als "Anmerkungen" bezeichnet) werden zu einem einzigen Label zusammengefasst. Danach werden die Anmerkungen mit einem Anmerkungskonsolidierungsalgorithmus verglichen. Dieser Algorithmus erkennt zunächst außergewöhnliche Anmerkungen (Ausreißer), die er ignoriert. Danach führt er eine gewichtete Konsolidierung der Anmerkungen durch, d. h. zuverlässigere Anmerkungen erhalten höhere Gewichtungen. Die letztliche Ausgabe ist ein einziges Label für jedes Objekt.

(b) Best Practices in der Anmerkungsschnittstelle: Mit diesen Funktionen der Anmerkungsschnittstelle führen Mitarbeiter ihre Aufgaben zuverlässiger aus. Menschen unterlaufen Fehler und neigen zu persönlichen Präferenzen, gut entwickelte Schnittstellen verbessern jedoch die Genauigkeit der menschlichen Eingaben. Bewährt hat sich zum Beispiel die Anzeige kurzer Anweisungen mit Beispielen guter und schlechter Kennzeichnungen in einem gesonderten Bereich am Seitenrand. Eine weitere Best Practice ist die Abdunklung des Bereichs außerhalb des Begrenzungsrahmens, wenn Benutzer einen solchen um ein Bild aufziehen.

F: Wie stellt Amazon SageMaker Ground Truth sicher, dass meine Daten geschützt und sicher sind?

A: Standardmäßig verschlüsselt Amazon SageMaker Ground Truth Daten im Speicher und während der Übertragung. Zudem können Sie den Zugriff auf Ihre Daten mit AWS Identity and Access Management (IAM) steuern. Ground Truth speichert Ihre Daten nicht außerhalb Ihrer AWS-Umgebung und erstellt auch keine Kopien davon. Ihre Daten bleiben immer unter Ihrer Kontrolle. Darüber hinaus unterstützt Ground Truth Compliance-Standards wie die Datenschutz-Grundverordnung (DSGVO) und bietet mit Amazon CloudWatch und Amazon CloudTrail umfassende Protokoll- und Prüffunktionen. Weitere Informationen zu Amazon SageMaker Ground Truth finden Sie in der Dokumentation.  

F: Wie greife ich über Amazon SageMaker Ground Truth auf eine menschliche Workforce zu?

A: In SageMaker Ground Truth können Sie sich für jede der drei folgenden Workforce Optionen entscheiden: (1) eine öffentliche Crowdsource-Workforce über Amazon Mechanical Turk, (2) externe Anbieter auf AWS Marketplace oder (3) Ihre eigenen Mitarbeiter. Weitere Informationen zu Amazon SageMaker Ground Truth finden Sie in der Dokumentation.  

Preise und Verfügbarkeit

F: Wie viel kostet Amazon SageMaker Ground Truth?

A: Auf der Seite mit den Preisen zu SageMaker Ground Truth finden Sie aktuelle Preisinformationen.

F: In welchen AWS-Regionen ist Amazon SageMaker Ground Truth verfügbar?

A: Amazon SageMaker Ground Truth ist derzeit in den AWS-Regionen North Virginia, Ohio, Oregon, Irland und Tokio verfügbar.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Informationen zu den Preisen von Amazon SageMaker Ground Truth

In Amazon SageMaker Ground Truth können Sie ohne Vorauszahlungen oder langfristige Verpflichtungen einsteigen. Weitere Informationen finden Sie auf der Seite mit der Preisübersicht zu Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Beginnen Sie mit der Entwicklung in der AWS-Konsole

Beginnen Sie mit der Entwicklung mit Amazon SageMaker Ground Truth in der AWS-Managementkonsole.

Anmeldung