Allgemeines

F: Was ist Amazon SageMaker Ground Truth?

A: Amazon SageMaker Ground Truth vereinfacht das effiziente und präzise Labeling von Datasets für das Training von Machine Learning-Systemen. SageMaker Ground Truth kann Teile eines Datasets automatisch auf Basis der manuell von Menschen vorgenommenen Labels kennzeichnen. Für das manuelle Labeling haben Sie die Wahl zwischen dem großen Crowdsourcing-Pool der Amazon Mechanical Turk-Workforce mit mehr als 500 000 Kennzeichnern, Ihren eigenen Mitarbeitern oder einem der von Amazon zuvor geprüften externen Labeling-Serviceprovider auf AWS Marketplace. Dabei verbessert SageMaker Ground Truth die Genauigkeit des menschlichen Labeling durch innovative Algorithmen und Endbenutzer (UX)-Techniken. Das Modell wird im Laufe der Zeit immer besser, denn es lernt beständig aus den von Menschen erstellten Labels, wovon die automatischen Prozesse nur profitieren.

F: Was ist automatisches Daten-Labeling?

A: Automatisches Daten-Labeling bezeichnet die Kennzeichnung von Daten mit Machine Learning-Techniken. Amazon SageMaker Ground Truth wählt zunächst ein zufälliges Datensample aus und sendet dieses zum Labeling an hierfür speziell qualifizierte menschliche Mitarbeiter. Anhand der Ergebnisse wird ein Labeling-Modell trainiert, das zum automatischen Labeling eines weiteren Datensamples verwendet wird. Die Labels werden jedoch erst festgeschrieben, wenn das Modell die Daten mit einer Zuverlässigkeit von mindestens einem sehr hohen Grenzwert kennzeichnen kann. Bei Nichterreichen dieses Grenzwerts werden die Daten an menschliche Kennzeichner gesendet. Aus einem Teil der von Menschen gekennzeichneten Daten wird wiederum ein neues Trainings-Dataset für das Labeling-Modell generiert, mit dem das Modell automatisch neu trainiert wird, um seine Genauigkeit zu verbessern. Dieser Prozess wiederholt sich mit jedem neu gekennzeichneten Rohdatensample. Bei jeder Wiederholung lernt das Modell dazu und wird immer präziser im Labeling der Rohdaten, so dass immer weniger Daten an Menschen gesendet werden müssen.

Verwenden von Amazon SageMaker Ground Truth

F: Warum sollte ich Amazon SageMaker Ground Truth verwenden?

A: Bevor Sie Machine Learning-Modelle erstellen, trainieren und bereitstellen, benötigen Sie Daten. Erfolgreiche Modelle setzen auf qualitativ hochwertigen Trainingsdaten auf, wobei die Erfassung und das Labeling der Trainings-Datasets sehr viel Zeit und Mühe beanspruchen. Für die Erstellung der Trainings-Datasets müssen menschliche Kennzeichner große Mengen an Bildern und anderen Datentypen untersuchen und daraus bestimmte Objekte erkennen und kennzeichnen. Diese Labeling-Aufgaben werden auf mehrere menschliche Mitarbeiter aufgeteilt, was zu einem beträchtlichen Mehraufwand und Kosten führt. Sollten den menschlichen Bearbeitern Fehler unterlaufen, lernt das System auch aus den Fehlinformationen und macht entsprechend ungenaue Aussagen.

Amazon SageMaker Ground Truth löst dieses Problem, indem es ein hoch genaues Daten-Labeling durch in Amazon S3 gespeicherte Daten sowie eine Kombination aus automatisch und von Menschen durchgeführtem Daten-Labeling verwendet.

F: Welches sind die ersten Schritte mit Amazon SageMaker Ground Truth?

A: Amazon SageMaker Ground Truth bietet einen verwalteten Prozess, mit dem Sie einen vollständigen Daten-Labeling-Auftrag in nur wenigen Schritten einrichten können. Wenn Sie mit Amazon SageMaker Ground Truth arbeiten möchten, melden Sie sich bei der AWS-Managementkonsole an und navigieren zur SageMaker-Konsole. Dort wählen Sie unter "Ground Truth" Labeling-Aufträge aus. Und schon können Sie Ihren Labeling-Auftrag erstellen. Zunächst geben Sie als Teil des Auftragserstellungsworkflows einen Pointer auf den S3-Bucket ein, der das zu kennzeichnende Dataset enthält. Ground Truth bietet Vorlagen für gängige Labeling-Aufgaben, in denen Sie nur wenige Einstellungen vornehmen und kaum Anweisungen zur Durchführung des Daten-Labeling eingeben müssen. Alternativ können Sie auch eigene Vorlagen erstellen. Zuletzt wählen Sie dann eine der drei angebotenen menschlichen Workforce-Optionen aus: (1) eine öffentliche Crowdsource-Workforce, (2) einen kuratierten Pool aus Anbietern von Daten-Labeling-Services oder (3) Ihre eigenen Mitarbeiter. Ebenso können Sie auch das automatische Daten-Labeling aktivieren.

F: Wie werden meine Trainings-Datasets mit Amazon SageMaker Ground Truth verwaltet?

A: Amazon SageMaker Ground Truth verwaltet Metadaten, zugehörige Labels sowie eine Taxonomie der Labels und Datasets. Zur Abfrage und Verwaltung Ihrer Datasets und Labels können Sie problemlos das AWS SDK über ein SageMaker Notebook oder die Ground Truth-Konsole über die SageMaker-Konsole verwenden. Weitere Informationen zu Amazon SageMaker Ground Truth finden Sie in der Dokumentation.

F: Wie hilft Amazon SageMaker Ground Truth bei der Verbesserung der Genauigkeit meiner Trainings-Datasets?

A: Amazon SageMaker Ground Truth bietet Ihnen die folgenden Funktionen zur Verbesserung der Genauigkeit des durch Menschen durchgeführten Daten-Labelings:

(a) Anmerkungskonsolidierung: Dadurch wird Fehlern oder tendenziösen Entscheidungen einzelner Mitarbeiter entgegen gewirkt. Jedes Datenobjekt wird mehreren Mitarbeitern zugesendet, und deren Antworten (als "Anmerkungen" bezeichnet) werden zu einem einzigen Label zusammengefasst. Danach werden die Anmerkungen mit einem Anmerkungskonsolidierungsalgorithmus verglichen. Dieser Algorithmus erkennt zunächst außergewöhnliche Anmerkungen (Ausreißer), die er ignoriert. Danach führt er eine gewichtete Konsolidierung der Anmerkungen durch, d. h. zuverlässigere Anmerkungen erhalten höhere Gewichtungen. Die letztliche Ausgabe ist ein einziges Label für jedes Objekt.

(b) Best Practices in der Anmerkungsschnittstelle: Mit diesen Funktionen der Anmerkungsschnittstelle führen Mitarbeiter ihre Aufgaben zuverlässiger aus. Menschen unterlaufen Fehler und neigen zu persönlichen Präferenzen, gut entwickelte Schnittstellen verbessern jedoch die Genauigkeit der menschlichen Eingaben. Bewährt hat sich zum Beispiel die Anzeige kurzer Anweisungen mit Beispielen guter und schlechter Kennzeichnungen in einem gesonderten Bereich am Seitenrand. Eine weitere Best Practice ist die Abdunklung des Bereichs außerhalb des Begrenzungsrahmens, wenn Benutzer einen solchen um ein Bild aufziehen.

F: Wie stellt Amazon SageMaker Ground Truth sicher, dass meine Daten geschützt und sicher sind?

A: Standardmäßig verschlüsselt Amazon SageMaker Ground Truth Daten im Speicher und während der Übertragung. Zudem können Sie den Zugriff auf Ihre Daten mit AWS Identity and Access Management (IAM) steuern. Ground Truth speichert Ihre Daten nicht außerhalb Ihrer AWS-Umgebung und erstellt auch keine Kopien davon. Ihre Daten bleiben immer unter Ihrer Kontrolle. Darüber hinaus unterstützt Ground Truth Compliance-Standards wie die Datenschutz-Grundverordnung (DSGVO) und bietet mit Amazon CloudWatch und Amazon CloudTrail umfassende Protokoll- und Prüffunktionen. Weitere Informationen zu Amazon SageMaker Ground Truth finden Sie in der Dokumentation.

F: Wie greife ich über Amazon SageMaker Ground Truth auf eine menschliche Workforce zu?

A: In SageMaker Ground Truth können Sie sich für jede der drei folgenden Workforce Optionen entscheiden: (1) eine öffentliche Crowdsource-Workforce über Amazon Mechanical Turk; (2) externe Labeling-Serviceanbieter auf AWS Marketplace; und (3) Ihre eigenen Mitarbeiter. Weitere Informationen zu Amazon SageMaker Ground Truth finden Sie in der Dokumentation.  

F: Kann Amazon SageMaker Ground Truth Data, ein Daten-Labeling-Serviceprovider, vertrauliche Daten verarbeiten?

A:  Ja, Amazon SageMaker Ground Truth kann als Daten-Labeling-Serviceprovider vertrauliche Daten verarbeiten. Die Standard-Servicevereinbarung zwischen AWS-Kunden und dem Daten-Labeling-Serviceprovider enthält einige grundlegende Schutzmaßnahmen für Ihre vertraulichen Informationen. Bitte lesen Sie diese Bedingungen, bevor Sie vertrauliche Informationen an den Serviceprovider weitergeben. Die Bedingungen finden Sie auf der Angebotsseite für den Serviceprovider auf dem AWS Marketplace.

F:   Welche Sicherheitsstandards muss Amazon SageMaker Ground Truth als Daten-Labeling-Serviceprovider erfüllen?

A:  Daten-Labeling-Serviceprovider sind verpflichtet, die Einhaltung von SOC 2 und die Zertifizierung jährlich zu prüfen zu lassen. Der SOC 2-Bericht ist eine Beschreibung der Kontrollumgebung des Serviceproviders, die auf den Trust Services-Kriterien des American Institute of Certified Public Accountants (AICPA) basiert - Sicherheit, Verfügbarkeit, Verarbeitungsintegrität, Vertraulichkeit und Datenschutz.

Zusätzlich zu SOC 2 sind Serviceprovider zu diesen zusätzlichen Sicherheitskontrollen verpflichtet, um die Sicherheit der Kundendaten zu gewährleisten.

Technologiekontrollen:
Serviceprovider sind verpflichtet, entsprechende Software einzusetzen, um Versuche zum Herunterladen oder Kopieren von Dateien/Daten aus ihren Systemen zu blockieren und den unbefugten Zugriff auf ihre Systeme zu verhindern. Serviceprovider sind auch verpflichtet, ihren Mitarbeitern zu untersagen, aufgabenbezogene Daten von Kunden zu speichern oder zu kopieren.

Netzwerksicherheitskontrollen:
Wir verlangen, dass das Netzwerk des Serviceproviders so konzipiert ist, dass ein Fernzugriff auf Ihre aufgabenbezogenen Daten nicht möglich ist. Darüber hinaus ist die Software für Peer-to-Peer-Dateisharing im Netzwerk des Anbieters blockiert, und die Firewall muss so konzipiert sein, dass sie eine hohe Verfügbarkeit gewährleistet.

Mitarbeiterkontrollen:
Serviceprovider sind verpflichtet sicherzustellen, dass sie mit ihren Mitarbeitern Vertraulichkeitsvereinbarungen (Non-Disclosure Agreements, NDAs) vereinbart haben. Serviceprovider sind verpflichtet, strenge Richtlinien zu erlassen, um Datenlecks zu verhindern und Mitarbeiter daran zu hindern, Informationen auf irgendeine Weise weiterzugeben: Papier, USBs, Mobiltelefone oder andere Medien.

Physische Zugangskontrollen:
Serviceprovider sind zu physischen Zugangskontrollmaßnahmen verpflichtet, um unbefugten Zugang zu ihrem Produktionsstandort zu verhindern. Dazu können Drehkreuze mit biometrischer Authentifizierung, Mitarbeiterausweiserkennung, usw. gehören.

F:   Wie trägt AWS dazu bei, dass Serviceprovider diese Sicherheitsstandards erfüllen?

A:  AWS fordert von Dienstleistern, dass sie ihre SOC 2-Zertifizierungsberichte vor der Aufnahme in den Markt einreichen und bestätigt dies:

Authentizität (ob der Auditor des Serviceproviders von der AICPA zertifiziert ist);

Berichtszeitraum (Gültigkeitsdatum der SOC 2-Zertifizierung); und

Produktionsstandort (der physische Standort, an dem die Mitarbeiter des Serviceproviders an den Labeling-Aufgaben für Amazon SageMaker Ground Truth arbeiten werden).

F:   Wie häufig werden die Sicherheitsstandards von Serviceprovidern überprüft?

A: Die Sicherheitsstandards der einzelnen Serviceprovider werden jährlich überprüft, um damit sicherzustellen, dass sie die verpflichtenden Anforderungen erfüllen.

F: Gibt es Ausnahmen von der AWS-Prüfung?

A: Nein. Wenn der Serviceprovider die Sicherheitsstandards nicht erfüllt, wird sein Eintrag aus dem AWS Marketplace entfernt. Das Löschen des Eintrags wird innerhalb von 24 Stunden abgeschlossen, und alle aktiven Kunden werden per E-Mail benachrichtigt.

F: Wenn der Serviceprovider Daten-Labeling-Services über mehrere Produktionsstandorte anbietet, müssen dann alle Standorte den Auditprozess durchlaufen?

A:  Ja, alle Standorte müssen die erforderlichen Sicherheitsstandards erfüllen.

F:   Was passiert, wenn es zu einer Datenschutzverletzung am Produktionsstandort des Serviceproviders kommt?

A: Der Serviceprovider muss AWS und die betroffenen Kunden innerhalb von 24 Stunden nach Feststellung eines tatsächlichen oder vermuteten unbefugten Zugriffs, der Abrufung, des Erwerbs, der Nutzung, der Übertragung, der Offenlegung, der Verfälschung oder des Verlusts von Kundendaten informieren. Der Serviceprovider wird jeden Sicherheitsvorfall unverzüglich beheben sowie AWS und den betroffenen Kunden schriftliche Details über die interne Untersuchung zur Verfügung stellen.

Verwenden von externen Serviceprovidern für das Daten-Labeling

F: Kann Amazon SageMaker Ground Truth Data, ein Daten-Labeling-Serviceprovider, vertrauliche Daten verarbeiten?

A:  Ja, Amazon SageMaker Ground Truth kann als Daten-Labeling-Serviceprovider vertrauliche Daten verarbeiten. Die Standard-Servicevereinbarung zwischen AWS-Kunden und dem Daten-Labeling-Serviceprovider enthält einige grundlegende Schutzmaßnahmen für Ihre vertraulichen Informationen. Bitte lesen Sie diese Bedingungen, bevor Sie vertrauliche Informationen an den Serviceprovider weitergeben. Die Bedingungen finden Sie auf der Angebotsseite für den Serviceprovider auf dem AWS Marketplace.

F:   Welche Sicherheitsstandards muss Amazon SageMaker Ground Truth als Daten-Labeling-Serviceprovider erfüllen?

A:  Daten-Labeling-Serviceprovider sind verpflichtet, die Einhaltung von SOC 2 und die Zertifizierung jährlich zu prüfen zu lassen. Der SOC 2-Bericht ist eine Beschreibung der Kontrollumgebung des Serviceproviders, die auf den Trust Services-Kriterien des American Institute of Certified Public Accountants (AICPA) basiert - Sicherheit, Verfügbarkeit, Verarbeitungsintegrität, Vertraulichkeit und Datenschutz.

Zusätzlich zu SOC 2 sind Serviceprovider zu diesen zusätzlichen Sicherheitskontrollen verpflichtet, um die Sicherheit der Kundendaten zu gewährleisten.

Technologiekontrollen:
Serviceprovider sind verpflichtet, entsprechende Software einzusetzen, um Versuche zum Herunterladen oder Kopieren von Dateien/Daten aus ihrem System zu blockieren und den unbefugten Zugriff auf ihre Systeme zu verhindern. Serviceprovider sind auch verpflichtet, ihren Mitarbeitern zu untersagen, aufgabenbezogene Daten von Kunden zu speichern oder zu kopieren.

Netzwerksicherheitskontrollen:
Wir verlangen, dass das Netzwerk des Serviceproviders so konzipiert ist, dass ein Fernzugriff auf die aufgabenbezogenen Daten des Kunden nicht möglich ist. Darüber hinaus ist die Software für Peer-to-Peer-Dateisharing im Netzwerk des Anbieters blockiert, und die Firewall muss so konzipiert sein, dass sie eine hohe Verfügbarkeit gewährleistet.

Mitarbeiterkontrollen:
Serviceprovider sind verpflichtet sicherzustellen, dass sie mit ihren Mitarbeitern Vertraulichkeitsvereinbarungen (Non-Disclosure Agreements, NDAs) vereinbart haben. Serviceprovider sind verpflichtet, strenge Richtlinien zu erlassen, um Datenlecks zu verhindern und Mitarbeiter daran zu hindern, Informationen auf irgendeine Weise weiterzugeben: Papier, USBs, Mobiltelefone oder andere Medien.

Physische Zugangskontrollen:
Serviceprovider sind zu physischen Zugangskontrollmaßnahmen verpflichtet, um unbefugten Zugang zu ihrem Produktionsstandort zu verhindern. Dazu können Drehkreuze mit biometrischer Authentifizierung, Mitarbeiterausweiserkennung, usw. gehören.

F:   Wie trägt AWS dazu bei, dass Serviceprovider diese Sicherheitsstandards erfüllen?

A:  AWS fordert von Dienstleistern, dass sie ihre SOC 2-Zertifizierungsberichte vor der Aufnahme in den Markt einreichen und bestätigt dies:

Authentizität (ob der Auditor des Serviceproviders von der AICPA zertifiziert ist);

Berichtszeitraum (Gültigkeitsdatum der SOC 2-Zertifizierung); und

Produktionsstandort (der physische Standort, an dem die Mitarbeiter des Serviceproviders an den Labeling-Aufgaben für Amazon SageMaker Ground Truth arbeiten werden).

F:   Wie häufig werden die Sicherheitsstandards von Serviceprovidern überprüft?

A:  Serviceprovider werden jährlich daraufhin überprüft, ob sie weiterhin die Sicherheitsstandards erfüllen.

F:   Gibt es Ausnahmen von der AWS-Prüfung?

A: Nein. Wenn der Serviceprovider die Sicherheitsstandards nicht erfüllt, wird sein Eintrag aus dem AWS Marketplace entfernt. Das Löschen des Eintrags wird innerhalb von 24 Stunden abgeschlossen, und alle aktiven Kunden werden per E-Mail benachrichtigt.

F: Wenn der Serviceprovider Daten-Labeling-Services über mehrere Produktionsstandorte anbietet, müssen dann alle Standorte den Auditprozess durchlaufen?

A:  Ja, alle Standorte müssen die erforderlichen Sicherheitsstandards erfüllen.

F:   Was passiert, wenn es zu einer Datenschutzverletzung am Produktionsstandort des Serviceproviders kommt?

A:  Der Serviceprovider informiert AWS und die betroffenen Kunden innerhalb von 24 Stunden nach Feststellung eines tatsächlichen oder vermuteten unbefugten Zugriffs, der Abrufung, des Erwerbs, der Nutzung, der Übertragung, der Offenlegung, der Verfälschung oder des Verlusts von Kundendaten. Der Serviceprovider wird jeden Sicherheitsvorfall unverzüglich beheben sowie AWS und den betroffenen Kunden schriftliche Details über die interne Untersuchung zur Verfügung stellen.

Preise und Verfügbarkeit

F: Wie viel kostet Amazon SageMaker Ground Truth?

A: Auf der Seite mit den Preisen zu SageMaker Ground Truth finden Sie aktuelle Preisinformationen.

F: In welchen AWS-Regionen ist Amazon SageMaker Ground Truth verfügbar?

A: Amazon SageMaker Ground Truth ist derzeit in den AWS-Regionen Nord-Virginia, Ohio, Oregon, Irland, Tokio und Sydney verfügbar.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Informationen zu den Preisen von Amazon SageMaker Ground Truth

In Amazon SageMaker Ground Truth können Sie ohne Vorauszahlungen oder langfristige Verpflichtungen einsteigen. Weitere Informationen finden Sie auf der Seite mit der Preisübersicht zu Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Beginnen Sie mit der Entwicklung in der Konsole

Beginnen Sie mit der Entwicklung mit Amazon SageMaker Ground Truth in der AWS-Managementkonsole.

Anmeldung