Publié le: Dec 1, 2021
Aujourd'hui, nous avons le plaisir d'annoncer la disponibilité pour tous d'Amazon SageMaker Ground Truth Plus, un nouveau service d'étiquetage des données complet qui vous permet de créer rapidement des jeux de données d'entraînement de haute qualité et de réduire les coûts jusqu'à 40 %.
Pour entraîner un modèle de machine learning (ML), les scientifiques des données ont besoin de grands jeux de données étiquetées de haute qualité. À mesure que l'adoption du ML se développe, les besoins en matière de labellisation croissent. Les scientifiques des données sont ainsi obligés de consacrer des semaines à la création de flux de travail destinés à l'étiquetage des données et à gérer une main-d'œuvre spécialisée dans ce domaine. Cette approche ralentit malheureusement l'innovation et augmente les coûts. Pour que les scientifiques des données puissent consacrer leur temps à la création, à l'entraînement et au déploiement de modèles de ML, ils chargent généralement d'autres équipes internes, composées de responsables des opérations de données et de responsables de programmes, de produire des jeux de données d'entraînement de haute qualité. Cependant, ces équipes n'ont généralement pas les compétences requises pour fournir des jeux de données de formation de haute qualité, ce qui a un impact sur les résultats du ML. Et si vous pouviez compter sur un service complet qui vous permette de créer des jeux de données d'entraînement de haute qualité à grande échelle sans consommer vos ressources internes ? Essayez Amazon SageMaker Ground Truth Plus.
Amazon SageMaker Ground Truth Plus facilite la création de jeux de données d'entraînement de haute qualité pour les scientifiques des données ainsi que pour les responsables d'entreprise notamment ceux des opérations de données et des programmes, en supprimant les tâches exigeantes indifférenciées associées à la création d'applications pour l'étiquetage des données et à la gestion de la main-d'œuvre affectée à cette tâche. Tout ce que vous avez à faire, c'est de partager vos données et vos exigences en matière d'étiquetage. Ground Truth Plus met en place et gère votre flux de travail d'étiquetage des données en fonction de ces exigences. À ce stade, une main-d'œuvre experte et entraînée à diverses tâches de ML procède à l'étiquetage des données. Une expertise approfondie en matière de ML ou une connaissance de la conception des flux de travail et de la gestion de la qualité ne sont absolument pas nécessaires pour utiliser Ground Truth Plus.
Ce service a recours à des techniques de ML, notamment l'apprentissage actif, le pré-étiquetage et la validation automatique. Cette approche permet d'améliorer la qualité du jeu de données de sortie et de réduire les coûts d'étiquetage des données. Ground Truth Plus garantit la transparence dans vos opérations d'étiquetage des données et de gestion de la qualité. En effet, il vous permet d'examiner la progression des jeux de données d'entraînement sur plusieurs projets, de suivre les métriques du projet telles que le débit quotidien, d'inspecter les étiquètes pour en vérifier la qualité et de fournir des commentaires sur les données étiquetées. Le service Ground Truth Plus convient à divers cas d'utilisation, notamment la reconnaissance d'image, le traitement du langage naturel et la reconnaissance vocale.
Amazon SageMaker Ground Truth Plus est actuellement disponible pour tous dans la région AWS USA Est (Virginie du Nord). Pour en savoir plus sur Amazon SageMaker Ground Truth Plus, veuillez consulter l'article de blog, la documentation de Ground Truth Plus et la page web SageMaker sur l'étiquetage des données ou la console Ground Truth Plus pour démarrer.