Veröffentlicht am: Dec 1, 2021

Wir freuen uns, heute die allgemeine Verfügbarkeit von Amazon SageMaker Ground Truth Plus ankündigen zu können, einem neuen schlüsselfertigen Datenbeschriftungsservice, mit dem Sie schnell hochwertige Trainingsdatensätze erstellen und die Kosten um bis zu 40 % senken können.

Zum Trainieren eines Modells für Machine Learning (ML) benötigen Datenwissenschaftler große, hochwertige, beschriftete Datensätze. Mit der zunehmenden Verbreitung von ML steigt auch der Bedarf an Beschriftungen. Dies zwingt Datenwissenschaftler dazu, wochenlang Workflows für die Datenbeschriftung zu entwickeln und Mitarbeiter für die Datenbeschriftung zu verwalten. Leider verlangsamt dies die Innovation und erhöht die Kosten. Um sicherzustellen, dass Datenwissenschaftler ihre Zeit mit der Entwicklung, dem Training und der Bereitstellung von ML-Modellen verbringen können, beauftragen sie in der Regel andere interne Teams, bestehend aus Data Operations Managern und Programm-Managern, mit der Erstellung hochwertiger Trainingsdatensätze. Diese Teams haben jedoch in der Regel keinen Zugang zu den Fähigkeiten, die für die Bereitstellung hochwertiger Trainingsdatensätze erforderlich sind, was die ML-Ergebnisse beeinträchtigt. Was wäre, wenn Sie sich auf einen schlüsselfertigen Service verlassen könnten, der es Ihnen ermöglicht, hochwertige Trainingsdatensätze in großem Umfang zu erstellen, ohne Ihre internen Ressourcen zu beanspruchen? Hier kommt Amazon SageMaker Ground Truth Plus ins Spiel.

Amazon SageMaker Ground Truth Plus macht es sowohl Datenwissenschaftlern als auch Geschäftsmanagern, wie z. B. Data Operations Managern und Programm-Managern, leicht, qualitativ hochwertige Trainingsdatensätze zu erstellen, indem ihnen die undifferenzierte Schwerarbeit abgenommen wird, die mit der Erstellung von Datenbeschriftungsanwendungen und der Verwaltung der Beschriftungsmitarbeiter verbunden ist. Alles, was Sie tun müssen, ist, die Daten zusammen mit den Beschriftungsanforderungen zu teilen, und Ground Truth Plus richtet Ihren Workflow zur Datenbeschriftung basierend auf diesen Anforderungen ein und verwaltet ihn. Die Datenbeschriftung wird dann von Experten durchgeführt, die in einer Vielzahl von ML-Aufgaben geschult sind. Für die Nutzung von Ground Truth Plus benötigen Sie keine tiefgreifenden ML-Kenntnisse oder Kenntnisse über Workflow-Design und Qualitätsmanagement.

Ground Truth Plus verwendet ML-Techniken, darunter aktives Lernen, Vorbeschriftung und maschinelle Validierung. Dies erhöht die Qualität des Ausgabedatensatzes und senkt die Kosten für die Datenbeschriftung. Ground Truth Plus bietet Transparenz für Ihre Datenbeschriftungsvorgänge und Ihr Qualitätsmanagement. Mit Ground Truth Plus können Sie den Fortschritt von Trainingsdatensätzen über mehrere Projekte hinweg überprüfen, Projektmetriken wie den täglichen Durchsatz verfolgen, Beschriftungen auf ihre Qualität hin überprüfen und Feedback zu den beschrifteten Daten geben. Ground Truth Plus kann für eine Vielzahl von Anwendungsfällen eingesetzt werden, darunter Computer Vision, natürliche Sprachverarbeitung und Spracherkennung.

Amazon SageMaker Ground Truth Plus ist ab heute in der AWS-Region USA Ost (Nord-Virginia) allgemein verfügbar. Weitere Informationen zu Amazon SageMaker Ground Truth Plus finden Sie in diesem Blogbeitrag, in der Dokumentation zu Ground Truth Plus sowie auf der SageMaker-Website zur Datenbeschriftung. Erste Schritte können Sie in der Ground-Truth-Plus-Konsole unternehmen.