Publié le: Jun 23, 2022

Nous avons le plaisir d'annoncer qu'Amazon SageMaker Ground Truth prend désormais en charge la génération de données synthétiques étiquetées pour qu'il ne soit plus nécessaire de collecter d'importantes quantités de données réelles à étiqueter manuellement. Amazon SageMaker propose deux offres en matière d'étiquetage des données : Amazon SageMaker Ground Truth Plus et Amazon SageMaker Ground Truth. Les deux options vous permettent d'identifier des données brutes, telles que des images, des fichiers texte et des vidéos, et d'ajouter des étiquettes informatives pour créer des jeux de données d'entraînement de haute qualité pour vos modèles de machine learning (ML).

SageMaker Ground Truth peut générer des données synthétiques étiquetées en votre nom que vous pouvez utiliser avec des données réelles afin d'entraîner vos modèles de ML sur un large choix de cas d'utilisation de reconnaissance d'image. Vous spécifiez vos exigences quant aux images synthétiques ou fournissez des ressources 3D ainsi que des images de base, et les graphistes numériques d'AWS génèrent des centaines de milliers d'images synthétiques automatiquement étiquetées. Les images générées imitent la pose et le placement des objets, incluent des variantes d'objets ou de scènes, et ajoutent éventuellement des inclusions spécifiques, telles que des rayures, des bosses et d'autres altérations qui n'apparaissent généralement pas dans les ensembles de données d'entraînement de ML.

La prise en charge par Amazon SageMaker Ground Truth de la génération de données synthétiques est disponible dans la région USA Est (Virginie du Nord).

Pour en savoir plus, consultez notre article de blog dédié à la génération de données synthétiques. Pour démarrer, remplissez le formulaire de projet ou rendez-vous dans la console de SageMaker Ground Truth.