Amazon SageMaker Ground Truth Plus

Allgemeines

F: Was ist Amazon SageMaker Ground Truth Plus?

A: Amazon SageMaker Ground Truth Plus ermöglicht das einfache Erstellen hochwertiger Trainingsdatensätze, ohne selbst Beschriftungsanwendungen entwickeln oder Beschriftungsmitarbeiter beschäftigen zu müssen. Sie geben Daten sowie Beschriftungsanforderungen an und SageMaker Ground Truth Plus übernimmt die Einrichtung und Verwaltung der Datenbeschriftungs-Workflows gemäß Ihren Anforderungen. Die Datenbeschriftung wird dann von Experten durchgeführt, die für eine Vielzahl von ML-Aufgaben (Machine Learning) geschult worden sind. Ground Truth Plus verwendet ML-Techniken, darunter aktives Lernen, Vorbeschriftung und maschinelle Validierung. Dies erhöht die Qualität des Ausgabedatensatzes und senkt die Kosten für die Datenbeschriftung. Ground Truth Plus bietet Transparenz für Ihre Datenbeschriftungsvorgänge und Ihr Qualitätsmanagement. Mit Ground Truth Plus können Sie den Fortschritt von Trainingsdatensätzen über mehrere Projekte hinweg überprüfen, Projektmetriken wie den täglichen Durchsatz verfolgen, Beschriftungen auf ihre Qualität hin überprüfen und Feedback zu den beschrifteten Daten geben. Ground Truth Plus kann für eine Vielzahl von Anwendungsfällen eingesetzt werden, darunter Computer Vision, natürliche Sprachverarbeitung und Spracherkennung.

F: Warum sollte ich Amazon SageMaker Ground Truth Plus verwenden?

A: Zum Trainieren eines ML-Modells (Machine Learning) benötigen Datenwissenschaftler große, hochwertige, beschriftete Datensätze. Mit der zunehmenden Verbreitung von ML steigt auch der Bedarf an Beschriftungen. Dies zwingt Datenwissenschaftler dazu, wochenlang Workflows für die Datenbeschriftung zu entwickeln und Mitarbeiter für die Datenbeschriftung zu verwalten. Leider verlangsamt dies die Innovation und erhöht die Kosten. Um sicherzustellen, dass Datenwissenschaftler ihre Zeit mit der Entwicklung, dem Training und der Bereitstellung von ML-Modellen verbringen können, beauftragen sie in der Regel andere interne Teams, bestehend aus Data Operations Managern und Programm-Managern, mit der Erstellung hochwertiger Trainingsdatensätze. Diese Teams haben jedoch in der Regel keinen Zugang zu den Fähigkeiten, die für die Bereitstellung hochwertiger Trainingsdatensätze erforderlich sind, was die ML-Ergebnisse beeinträchtigt.

Amazon SageMaker Ground Truth Plus macht es sowohl Datenwissenschaftlern als auch Geschäftsmanagern, wie z. B. Data Operations Managern und Programm-Managern, leicht, qualitativ hochwertige Trainingsdatensätze zu erstellen, indem ihnen die undifferenzierte Schwerarbeit abgenommen wird, die mit der Erstellung von Datenbeschriftungsanwendungen und der Verwaltung der Beschriftungsmitarbeiter verbunden ist. Alles, was Sie tun müssen, ist, die Daten zusammen mit den Beschriftungsanforderungen zu teilen, und Ground Truth Plus richtet Ihren Workflow zur Datenbeschriftung basierend auf diesen Anforderungen ein und verwaltet ihn. Die Datenbeschriftung wird dann von Experten durchgeführt, die in einer Vielzahl von ML-Aufgaben geschult sind. Für die Nutzung von Ground Truth Plus benötigen Sie keine tiefgreifenden ML-Kenntnisse oder Kenntnisse über Workflow-Design und Qualitätsmanagement.

F: Wie beginne ich mit Amazon SageMaker Ground Truth Plus?

A: Um mit Amazon SageMaker Ground Truth Plus zu beginnen, füllen Sie bitte das Anforderungsformular für das Projekt aus. Unser Team meldet sich dann, um Ihr Datenbeschriftungsprojekt mit Ihnen zu besprechen.

F: Wie hilft mir Amazon SageMaker Ground Truth Plus beim Verwalten meiner Trainingsdatensätze?

A: Amazon SageMaker Ground Truth Plus verschafft Ihnen mehr Transparenz bei Datenbeschriftungsvorgängen und Qualitätsmanagement. Zum Beispiel liefert SageMaker Ground Truth Plus eine Projektansicht, die Sie verwenden können, um den Fortschritt von Trainingsdatensätzen in verschiedenen Projekten zu überwachen. Zudem gibt es ein Dashboard mit Echtzeitmetriken, damit Sie Metriken Ihres Projekts wie den täglichen Durchsatz detailliert nachverfolgen können. SageMaker Ground Truth Plus bietet außerdem eine Benutzeroberfläche, mit der Sie die Qualität der Beschriftungen untersuchen und Feedback in Echtzeit geben können. Schließlich erhalten Sie mit dem Streaming-Modus bei bestimmten Workload-Typen die Beschriftungsergebnisse noch am selben Tag oder in derselben Stunde.

F: Wie hilft Amazon SageMaker Ground Truth Plus bei der Verbesserung der Genauigkeit meiner Trainingsdatensätze?

Ground Truth Plus nutzt verschiedene Techniken, um die Genauigkeit der Trainingsdatensätze zu erhöhen:

  • ML-Techniken: Ground Truth Plus verwendet ML-Techniken, darunter aktives Lernen, Vorbeschriftung und maschinelle Validierung, womit die Qualität des Ausgabedatensatzes steigt und die Kosten der Datenbeschriftung sinken. Ein Beschriftungs-Workflow von Ground Truth Plus mit mehreren Schritten beinhaltet ML-Modelle für aktives Lernen, um durch Auswahl der Beschriftungselemente die Kosten zu reduzieren, und ML-Modelle für die Vorbeschriftung von ausgewählten Daten, um den menschlichen Aufwand zu reduzieren. Ground Truth Plus verwendet maschinelle Validierung zur Identifizierung potenzieller Fehler, die dann noch einmal von Mitarbeitern überprüft werden können. Dadurch wird die Beschriftungsqualität deutlich verbessert, da menschliche Fehler abgefangen werden.
  • Intuitive Beschriftungsoberfläche: Ground Truth Plus verwendet unterstützende Beschriftungsfunktionen wie (1) Andocken, um bei einem nicht perfekten 3D-Quader anzudocken und das zu umschließende Objekt genau abzudecken. (2) Auto-Segmentierung, um eine Objektmaske mit nur vier Klicks an den äußersten Punkten zu erstellen.

Datenschutz

F: Wie hilft Amazon SageMaker Ground Truth Plus dabei, dass meine Daten geschützt und sicher sind?

A: Amazon SageMaker Ground Truth Plus verschlüsselt Daten, die in einem Amazon-S3-Bucket gespeichert sind, standardmäßig im Ruhezustand und bei der Übertragung. Zudem wird der Zugriff auf Ihre Daten mit AWS Identity and Access Management (IAM) gesteuert. Ihre Daten werden in einem unabhängigen AWS-Konto gespeichert und ein Amazon-S3-Bucket wird für Ihr Projekt erstellt. Amazon SageMaker Ground Truth Plus speichert oder kopiert Ihre Daten nicht außerhalb der für Sie erstellten AWS-Umgebung. AWS-Protokolle und -Prüfungen greifen auf Ihre Daten mithilfe von Amazon-S3-Zugriffsprotokollierung und AWS CloudTrail zu.

F: Wer hat Zugriff auf meine Inhalte, die von Amazon SageMaker Ground Truth Plus verarbeitet und gespeichert werden?

A: Autorisierte AWS-Mitarbeiter und die Experten, die Ihre Daten beschriften, haben Zugriff auf Ihre Inhalte, die von Amazon SageMaker Ground Truth Plus verarbeitet werden. Die Experten, die Ihre Daten beschriften, überprüfen und beschriften sie über das sichere Mitarbeiterportal von Amazon SageMaker Ground Truth Plus. Mit dem Zugriff über das Mitarbeiterportal können die Mitarbeiter die Daten nur anzeigen und beschriften, sie aber nicht bearbeiten oder löschen. Vertrauen, Datenschutz und Sicherheit haben für uns die höchste Priorität. Wir implementieren geeignete technische und physische Kontrollen, einschließlich Verschlüsselung für Daten im Ruhezustand und bei der Übertragung, um den unbefugten Zugriff auf Ihre Inhalte oder deren Offenlegung zu verhindern.

F: Werden eingehende Daten (Bilder, Textdateien, Videos usw.) von Amazon SageMaker Ground Truth Plus gespeichert? Und wie werden sie von AWS verwendet?

A: Amazon SageMaker Ground Truth Plus speichert die rohen und die verarbeiteten Inhalte nur für die Dauer Ihrer Projekte und löscht auf Anfrage die Inhalte in Verbindung mit Ihrem Datenbeschriftungsprojekt. Amazon SageMaker Ground Truth Plus verwendet Ihre Inhalte ausschließlich zur Bereitstellung und Verwaltung des Services. Amazon SageMaker Ground Truth Plus verwendet niemals Ihre Inhalte oder trainierten Modelle für diese Inhalte zum Nutzen anderer Kunden.

F: Verlassen von Amazon SageMaker Ground Truth Plus verarbeitete Inhalte die AWS-Region, in der ich Amazon SageMaker Ground Truth Plus verwende?

A: Alle von Amazon SageMaker Ground Truth Plus verarbeiteten Inhalte werden in der AWS-Region, in der Sie Amazon SageMaker Ground Truth Plus verwenden, im Ruhezustand verschlüsselt und gespeichert. Sofern Sie es nicht anderweitig in beidseitig vereinbarten Anforderungen an die Datenlokalisierung im Rahmen einer Leistungsbeschreibung (Statement of Work) festlegen, kann von außerhalb der AWS-Region, in der Ihre Inhalte gespeichert sind, auf Ihre Inhalte zugegriffen werden, um den Beschriftungsservice durchzuführen.

F: Kann ich die Löschung von Daten (Bilder, Textdateien, Videos usw.) anfordern, die bei Amazon SageMaker Ground Truth Plus gespeichert sind?

A: Ja. Sie können die Löschung von eingegangenen rohen und verarbeiteten Daten in Verbindung mit Ihrem Datenbeschriftungsprojekt anfordern, indem Sie den AWS Support kontaktieren.

F: Bleibe ich der Eigentümer meiner Inhalte, die von Amazon SageMaker Ground Truth Plus verarbeitet und gespeichert werden?

A: Ja. Sie behalten immer die Eigentümerschaft an den Inhalten und wir verwenden Ihre Inhalte nur mit Ihrer Zustimmung.

F: Kann ich personenbezogene Gesundheitsdaten (Personal Health Information) über Amazon SageMaker Ground Truth Plus verarbeiten?

A: Nein. Amazon SageMaker Ground Truth Plus ist derzeit kein HIPAA-konformer Service.

Experten

F: Was sind Experten bei Amazon SageMaker Ground Truth Plus?

Bei Ground Truth Plus wird die Beschriftung von versierten, diversen und flexiblen Experten erledigt, die für Machine-Learning-Aufgaben geschult wurden und vielfältige Anforderungen erfüllen, darunter Datensicherheit, Datenschutz und Compliance. Es gibt zwei Arten von Experten, 1) Amazon-Experten: Das sind Mitarbeiter, die bei Amazon angestellt und zugeteilt werden, wobei Amazon für Ihre SLAs bezüglich Betrieb, Qualität und Durchlaufzeit zuständig ist. 2) Drittanbieter-Experten: Das sind Mitarbeiter, die über eine kuratierte Liste von Drittanbietern eingesetzt werden, die auf die Bereitstellung von Datenbeschriftungsservices spezialisiert sind, wobei Amazon für Ihre SLAs bezüglich Qualität und Durchlaufzeit zuständig ist.

F: Wer entscheidet, welche Art von Experten für mein Projekt bei Amazon SageMaker Ground Truth Plus verwendet wird?

Sie können über die Art von Experten entscheiden, die bei Ihrem Projekt eingesetzt werden. Sofern Sie uns nicht dazu anweisen, bestimmte Experten zu verwenden, können wir Amazon-Experten, Drittanbieter-Experten oder eine Kombination aus beidem einsetzen, um die Anforderungen Ihres Projekts bezüglich Qualität, Durchlaufzeit und Sicherheit zu erfüllen.

F: Welche Änderungen führen Drittanbieter-Experten im Hinblick auf COVID-19 ein, über die ich informiert werden muss?

A: Angesichts COVID-19 haben einige Serviceprovider ihren Mitarbeitern eingeräumt, von zu Hause zu arbeiten, um für ihre Gesundheit und Sicherheit zu sorgen.

F: Welche Sicherheitsstandards müssen Drittanbieter-Experten erfüllen?

A: Serviceprovider müssen sich jährlich der SOC 2-Compliance oder ISO 27001-Zertifizierung durch einen unabhängigen Prüfer unterziehen.

Der SOC 2-Bericht ist eine Beschreibung der Kontrollumgebung des Serviceproviders, die auf den Trust Services-Kriterien des American Institute of Certified Public Accountants (AICPA) basiert - Sicherheit, Verfügbarkeit, Verarbeitungsintegrität, Vertraulichkeit und Datenschutz.

Die Zertifizierung gemäß ISO 27001 stammt von der Internationalen Organisation für Normung (ISO) und der Internationalen Elektrotechnischen Kommission (IEC). Sie legt Anforderungen für die Entwicklung, Implementierung, Verwaltung und kontinuierliche Verbesserung eines Information Security Management System (ISMS) fest.

Zusätzlich zur unabhängigen Prüfung gemäß SOC 2 oder ISO 27001 müssen Serviceprovider weitere Sicherheitskontrollen, die im Folgenden beschrieben sind, zum Schutz Ihrer Daten verwenden.

Technologiekontrollen:
Serviceprovider sind verpflichtet, entsprechende Software einzusetzen, um Versuche zum Herunterladen oder Kopieren von Dateien/Daten aus ihrem System zu blockieren und den unbefugten Zugriff auf ihre Systeme zu verhindern. Serviceprovider sind auch verpflichtet, ihren Mitarbeitern zu untersagen, aufgabenbezogene Daten von Kunden zu speichern oder zu kopieren.

Netzwerksicherheitskontrollen:
Wir verlangen, dass das Netzwerk des Serviceproviders so konzipiert ist, dass ein Fernzugriff auf die aufgabenbezogenen Daten des Kunden nicht möglich ist. Darüber hinaus ist die Software für Peer-to-Peer-Dateisharing im Netzwerk des Anbieters blockiert, und die Firewall muss so konzipiert sein, dass sie eine hohe Verfügbarkeit gewährleistet.

Mitarbeiterkontrollen:
Serviceprovider sind verpflichtet, sicherzustellen, dass sie mit ihren Mitarbeitern Vertraulichkeitsvereinbarungen (Non-Disclosure Agreements, NDAs) vereinbart haben. Serviceprovider sind verpflichtet, strenge Richtlinien zu erlassen, um Datenlecks zu verhindern und Mitarbeiter daran zu hindern, Informationen auf irgendeine Weise weiterzugeben: Papier, USB-Speicher, Mobiltelefone oder andere Medien.

Physische Zugangskontrollen:
Serviceprovider sind zu physischen Zugangskontrollmaßnahmen verpflichtet, um unbefugten Zugang zu ihrem Produktionsstandort zu verhindern. Dazu können Drehkreuze mit biometrischer Authentifizierung, Mitarbeiterausweiserkennung, usw. gehören.

F: Wie trägt AWS dazu bei, dass Drittanbieter-Experten diese Sicherheitsstandards erfüllen?

A: Serviceprovider müssen ihre Berichte zur Erfüllung von SOC 2 oder der ISO 27001-Zertifizierung für AWS bereitstellen, bevor sie bei den Drittanbieter-Experten von Amazon SageMaker Ground Truth Plus aufgenommen werden. AWS-SOC-Berichte und -ISO-Zertifizierungen gelten nicht für die Drittanbieter-Experten.

Amazon SageMaker Ground Truth

Allgemeines

F: Was ist Amazon SageMaker Ground Truth?

A: Amazon SageMaker Ground Truth vereinfacht das effiziente und präzise Labeling von Datasets für das Training von Machine Learning-Systemen. SageMaker Ground Truth kann Teile eines Datasets automatisch auf Basis der manuell von Menschen vorgenommenen Labels kennzeichnen. Für das manuelle Labeling haben Sie die Wahl zwischen dem großen Crowdsourcing-Pool der Amazon Mechanical Turk-Workforce mit mehr als 500 000 Kennzeichnern, Ihren eigenen Mitarbeitern oder einem der von Amazon zuvor geprüften externen Labeling-Serviceprovider auf AWS Marketplace. SageMaker Ground Truth verwendet innovative Algorithmen und User Experience (UX) Techniken, um die Genauigkeit der menschlichen Beschriftung zu verbessern. Im Laufe der Zeit wird das Modell immer besser, da es kontinuierlich aus den von Menschen erstellten Beschriftungen lernt, um die automatische Beschriftung zu verbessern.

F: Was ist automatische Datenbeschriftung?

A: Automatisches Daten-Labeling bezeichnet die Kennzeichnung von Daten mit Machine Learning-Techniken. Amazon SageMaker Ground Truth wählt zunächst ein zufälliges Datensample aus und sendet dieses zum Labeling an hierfür speziell qualifizierte menschliche Mitarbeiter. Anhand der Ergebnisse wird ein Labeling-Modell trainiert, das zum automatischen Labeling eines weiteren Datensamples verwendet wird. Die Labels werden jedoch erst festgeschrieben, wenn das Modell die Daten mit einer Zuverlässigkeit von mindestens einem sehr hohen Grenzwert kennzeichnen kann. Bei Nichterreichen dieses Grenzwerts werden die Daten an menschliche Kennzeichner gesendet. Aus einem Teil der von Menschen gekennzeichneten Daten wird wiederum ein neues Trainings-Dataset für das Labeling-Modell generiert, mit dem das Modell automatisch neu trainiert wird, um seine Genauigkeit zu verbessern. Dieser Prozess wiederholt sich mit jedem neu gekennzeichneten Rohdatensample. Bei jeder Wiederholung lernt das Modell dazu und wird immer präziser im Labeling der Rohdaten, so dass immer weniger Daten an Menschen gesendet werden müssen.

Verwenden von Amazon SageMaker Ground Truth

F: Warum sollte ich Amazon SageMaker Ground Truth verwenden?

A: Bevor Sie Machine Learning-Modelle erstellen, trainieren und bereitstellen, benötigen Sie Daten. Erfolgreiche Modelle setzen auf qualitativ hochwertigen Trainingsdaten auf, wobei die Erfassung und das Labeling der Trainings-Datasets sehr viel Zeit und Mühe beanspruchen. Für die Erstellung der Trainings-Datasets müssen menschliche Kennzeichner große Mengen an Bildern und anderen Datentypen untersuchen und daraus bestimmte Objekte erkennen und kennzeichnen. Diese Labeling-Aufgaben werden auf mehrere menschliche Mitarbeiter aufgeteilt, was zu einem beträchtlichen Mehraufwand und Kosten führt. Sollten den menschlichen Bearbeitern Fehler unterlaufen, lernt das System auch aus den Fehlinformationen und macht entsprechend ungenaue Aussagen.

Amazon SageMaker Ground Truth löst dieses Problem, indem es ein hoch genaues Daten-Labeling durch in Amazon S3 gespeicherte Daten sowie eine Kombination aus automatisch und von Menschen durchgeführtem Daten-Labeling verwendet.

F: Welches sind die ersten Schritte mit Amazon SageMaker Ground Truth?

A: Amazon SageMaker Ground Truth bietet einen verwalteten Prozess, mit dem Sie einen vollständigen Daten-Labeling-Auftrag in nur wenigen Schritten einrichten können. Wenn Sie mit Amazon SageMaker Ground Truth arbeiten möchten, melden Sie sich bei der AWS-Managementkonsole an und navigieren zur SageMaker-Konsole. Dort wählen Sie unter "Ground Truth" Labeling-Aufträge aus. Und schon können Sie Ihren Labeling-Auftrag erstellen. Zunächst geben Sie als Teil des Auftragserstellungsworkflows einen Pointer auf den S3-Bucket ein, der das zu kennzeichnende Dataset enthält. Ground Truth bietet Vorlagen für gängige Labeling-Aufgaben, in denen Sie nur wenige Einstellungen vornehmen und kaum Anweisungen zur Durchführung des Daten-Labeling eingeben müssen. Alternativ können Sie auch eigene Vorlagen erstellen. Zuletzt wählen Sie dann eine der drei angebotenen menschlichen Workforce-Optionen aus: (1) eine öffentliche Crowdsource-Workforce, (2) einen kuratierten Pool aus Anbietern von Daten-Labeling-Services oder (3) Ihre eigenen Mitarbeiter. Ebenso können Sie auch das automatische Daten-Labeling aktivieren.

F: Wie werden meine Trainings-Datasets mit Amazon SageMaker Ground Truth verwaltet?

A: Amazon SageMaker Ground Truth verwaltet Metadaten, zugehörige Labels sowie eine Taxonomie der Labels und Datasets. Zur Abfrage und Verwaltung Ihrer Datasets und Labels können Sie problemlos das AWS SDK über ein SageMaker Notebook oder die Ground Truth-Konsole über die SageMaker-Konsole verwenden. Weitere Informationen zu Amazon SageMaker Ground Truth finden Sie in der Dokumentation.

F: Wie hilft Amazon SageMaker Ground Truth bei der Verbesserung der Genauigkeit meiner Trainings-Datasets?

A: Amazon SageMaker Ground Truth bietet Ihnen die folgenden Funktionen zur Verbesserung der Genauigkeit des durch Menschen durchgeführten Daten-Labelings:

(a) Anmerkungskonsolidierung: Dadurch wird Fehlern oder tendenziösen Entscheidungen einzelner Mitarbeiter entgegen gewirkt. Jedes Datenobjekt wird mehreren Mitarbeitern zugesendet, und deren Antworten (als "Anmerkungen" bezeichnet) werden zu einem einzigen Label zusammengefasst. Danach werden die Anmerkungen mit einem Anmerkungskonsolidierungsalgorithmus verglichen. Dieser Algorithmus erkennt zunächst außergewöhnliche Anmerkungen (Ausreißer), die er ignoriert. Danach führt er eine gewichtete Konsolidierung der Anmerkungen durch, d. h. zuverlässigere Anmerkungen erhalten höhere Gewichtungen. Die letztliche Ausgabe ist ein einziges Label für jedes Objekt.

(b) Best Practices in der Anmerkungsschnittstelle: Mit diesen Funktionen der Anmerkungsschnittstelle führen Mitarbeiter ihre Aufgaben zuverlässiger aus. Menschen unterlaufen Fehler und neigen zu persönlichen Präferenzen, gut entwickelte Schnittstellen verbessern jedoch die Genauigkeit der menschlichen Eingaben. Bewährt hat sich zum Beispiel die Anzeige kurzer Anweisungen mit Beispielen guter und schlechter Kennzeichnungen in einem gesonderten Bereich am Seitenrand. Eine weitere Best Practice ist die Abdunklung des Bereichs außerhalb des Begrenzungsrahmens, wenn Benutzer einen solchen um ein Bild aufziehen.

F: Wie stellt Amazon SageMaker Ground Truth sicher, dass meine Daten geschützt und sicher sind?

A: Standardmäßig verschlüsselt Amazon SageMaker Ground Truth Daten im Speicher und während der Übertragung. Zudem können Sie den Zugriff auf Ihre Daten mit AWS Identity and Access Management (IAM) steuern. Ground Truth speichert Ihre Daten nicht außerhalb Ihrer AWS-Umgebung und erstellt auch keine Kopien davon. Ihre Daten bleiben immer unter Ihrer Kontrolle. Darüber hinaus unterstützt Ground Truth Compliance-Standards wie die Datenschutz-Grundverordnung (DSGVO) und bietet mit Amazon CloudWatch und Amazon CloudTrail umfassende Protokoll- und Prüffunktionen. Weitere Informationen zu Amazon SageMaker Ground Truth finden Sie in der Dokumentation.

F: Wie greife ich über Amazon SageMaker Ground Truth auf eine menschliche Workforce zu?

A: In SageMaker Ground Truth können Sie sich für jede der drei folgenden Workforce Optionen entscheiden: (1) eine öffentliche Crowdsource-Workforce über Amazon Mechanical Turk; (2) externe Labeling-Serviceanbieter auf AWS Marketplace; und (3) Ihre eigenen Mitarbeiter. Weitere Informationen zu Amazon SageMaker Ground Truth finden Sie in der Dokumentation.  

Verwenden von externen Serviceprovidern für das Daten-Labeling

F:Können Anbieter von Amazon-SageMaker-Ground-Truth-Datenbeschriftung vertrauliche Daten verarbeiten?

A:  Ja, Amazon SageMaker Ground Truth kann als Daten-Labeling-Serviceprovider vertrauliche Daten verarbeiten. Die Standard-Servicevereinbarung zwischen AWS-Kunden und dem Daten-Labeling-Serviceprovider enthält einige grundlegende Schutzmaßnahmen für Ihre vertraulichen Informationen. Bitte lesen Sie diese Bedingungen, bevor Sie vertrauliche Informationen an den Serviceprovider weitergeben. Die Bedingungen finden Sie auf der Angebotsseite für den Serviceprovider auf dem AWS Marketplace.

F:   Ich arbeite über den AWS Marketplace mit einem externen Serviceprovider zusammen. Welche Änderungen führen Serviceprovider im Hinblick auf COVID-19 ein, über die ich informiert werden muss?

A:  Angesichts der sich rasch entwickelnden Auswirkungen von COVID-19 haben einige Serviceprovider ihren Mitarbeitern vorübergehend eingeräumt, von zu Hause zu arbeiten, um ihre Gesundheit und Sicherheit zu verbessern. Während dieser Zeit sind die Sicherheitsstandards, einschließlich der Einhaltung von SOC 2 und zusätzlicher Sicherheitskontrollen, die in den unten stehenden FAQs beschrieben sind, möglicherweise nicht auf die betroffenen Serviceprovider anwendbar. Betroffene Serviceprovider haben ihre AWS Marketplace-Einträge entsprechend aktualisiert und werden Kundendaten aus entfernten Arbeitsumgebungen nicht ohne ausdrückliche Zustimmung der Kunden verarbeiten.

F:   Welche Sicherheitsstandards muss Amazon SageMaker Ground Truth als Daten-Labeling-Serviceprovider erfüllen?

A:  Daten-Labeling-Serviceprovider sind verpflichtet, die Einhaltung von SOC 2 und die Zertifizierung jährlich zu prüfen zu lassen. Der SOC 2-Bericht ist eine Beschreibung der Kontrollumgebung des Serviceproviders, die auf den Trust Services-Kriterien des American Institute of Certified Public Accountants (AICPA) basiert - Sicherheit, Verfügbarkeit, Verarbeitungsintegrität, Vertraulichkeit und Datenschutz.

Zusätzlich zu SOC 2 sind Serviceprovider zu diesen zusätzlichen Sicherheitskontrollen verpflichtet, um die Sicherheit der Kundendaten zu gewährleisten.

Technologiekontrollen:
Serviceprovider sind verpflichtet, entsprechende Software einzusetzen, um Versuche zum Herunterladen oder Kopieren von Dateien/Daten aus ihrem System zu blockieren und den unbefugten Zugriff auf ihre Systeme zu verhindern. Serviceprovider sind auch verpflichtet, ihren Mitarbeitern zu untersagen, aufgabenbezogene Daten von Kunden zu speichern oder zu kopieren.

Netzwerksicherheitskontrollen:
Wir verlangen, dass das Netzwerk des Serviceproviders so konzipiert ist, dass ein Fernzugriff auf die aufgabenbezogenen Daten des Kunden nicht möglich ist. Darüber hinaus ist die Software für Peer-to-Peer-Dateisharing im Netzwerk des Anbieters blockiert, und die Firewall muss so konzipiert sein, dass sie eine hohe Verfügbarkeit gewährleistet.

Mitarbeiterkontrollen:
Serviceprovider sind verpflichtet sicherzustellen, dass sie mit ihren Mitarbeitern Vertraulichkeitsvereinbarungen (Non-Disclosure Agreements, NDAs) vereinbart haben. Serviceprovider sind verpflichtet, strenge Richtlinien zu erlassen, um Datenlecks zu verhindern und Mitarbeiter daran zu hindern, Informationen auf irgendeine Weise weiterzugeben: Papier, USBs, Mobiltelefone oder andere Medien.

Physische Zugangskontrollen:
Serviceprovider sind zu physischen Zugangskontrollmaßnahmen verpflichtet, um unbefugten Zugang zu ihrem Produktionsstandort zu verhindern. Dazu können Drehkreuze mit biometrischer Authentifizierung, Mitarbeiterausweiserkennung, usw. gehören.

F:   Wie trägt AWS dazu bei, dass Serviceprovider diese Sicherheitsstandards erfüllen?

A:  AWS fordert von Dienstleistern, dass sie ihre SOC 2-Zertifizierungsberichte vor der Aufnahme in den Markt einreichen und bestätigt dies:

Authentizität (ob der Auditor des Serviceproviders von der AICPA zertifiziert ist);

Berichtszeitraum (Gültigkeitsdatum der SOC 2-Zertifizierung); und

Produktionsstandort (der physische Standort, an dem die Mitarbeiter des Serviceproviders an den Labeling-Aufgaben für Amazon SageMaker Ground Truth arbeiten werden).

F:   Wie häufig werden die Sicherheitsstandards von Serviceprovidern überprüft?

A: Die Sicherheitsstandards der einzelnen Serviceprovider werden jährlich überprüft, um damit sicherzustellen, dass sie die verpflichtenden Anforderungen erfüllen.

F: Gibt es Ausnahmen von der AWS-Prüfung?

A: Nein. Wenn der Serviceprovider die Sicherheitsstandards nicht erfüllt, wird sein Eintrag aus dem AWS Marketplace entfernt. Das Löschen des Eintrags wird innerhalb von 24 Stunden abgeschlossen, und alle aktiven Kunden werden per E-Mail benachrichtigt.

F: Wenn der Serviceprovider Daten-Labeling-Services über mehrere Produktionsstandorte anbietet, müssen dann alle Standorte den Auditprozess durchlaufen?

A:  Ja, alle Standorte müssen die erforderlichen Sicherheitsstandards erfüllen.

F:   Was passiert, wenn es zu einer Datenschutzverletzung am Produktionsstandort des Serviceproviders kommt?

A:  Der Serviceprovider informiert AWS und die betroffenen Kunden innerhalb von 24 Stunden nach Feststellung eines tatsächlichen oder vermuteten unbefugten Zugriffs, der Abrufung, des Erwerbs, der Nutzung, der Übertragung, der Offenlegung, der Verfälschung oder des Verlusts von Kundendaten. Der Serviceprovider wird jeden Sicherheitsvorfall unverzüglich beheben sowie AWS und den betroffenen Kunden schriftliche Details über die interne Untersuchung zur Verfügung stellen.

Preise und Verfügbarkeit

F: Wie viel kostet Amazon SageMaker Ground Truth?

A: Auf der Preisseite zu SageMaker Ground Truth finden Sie aktuelle Preisinformationen.

F: In welchen AWS-Regionen ist Amazon SageMaker Ground Truth verfügbar?

A: In der AWS-Regionstabelle finden Sie alle AWS-Regionen, in denen Amazon SageMaker Ground Truth aktuell verfügbar ist.

Amazon SageMaker Ground Truth – Preise
Weitere Informationen zu den Preisen der Amazon-SageMaker-Datenbeschriftung

Sie können mit der Verwendung der Amazon-SageMaker-Datenbeschriftung ohne Vorauszahlungen oder langfristige Verpflichtungen beginnen.

Weitere Informationen 
Registrieren Sie sich für ein AWS-Konto
Für ein kostenloses Konto registrieren

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Beginnen Sie mit dem Erstellen in der Konsole
Beginnen Sie mit der Entwicklung in der Konsole

Beginnen Sie die Entwicklung mit der Amazon-SageMaker-Datenbeschriftung in der AWS-Managementkonsole.

Anmelden