Amazon SageMaker Ground Truth Plus

Questions d'ordre général

Q : Qu'est-ce qu'Amazon SageMaker Ground Truth Plus ?

Amazon SageMaker Ground Truth Plus vous permet de créer facilement des jeux de données d'entraînement de haute qualité sans avoir à créer des applications d'étiquetage ou à gérer la main-d'œuvre d'étiquetage vous-même Une fois que vous fournissez les données, ainsi que les exigences d'étiquetage, SageMaker Ground Truth Plus prend en charge les flux d'étiquetage des données et les gère pour vous, conformément aux exigences que vous avez définies. À ce stade, une main-d'œuvre experte et entraînée à diverses tâches de machine learning (ML) procède à l'étiquetage des données. Ground Truth Plus utilise les techniques de ML, notamment l'apprentissage actif, le pré-étiquetage et la validation automatique. Cette approche permet d'améliorer la qualité du jeu de données de sortie et de réduire les coûts d'étiquetage des données. Ground Truth Plus garantit la transparence dans vos opérations d'étiquetage des données et de gestion de la qualité. En effet, il vous permet d'examiner la progression des jeux de données d'entraînement sur plusieurs projets, de suivre les métriques du projet telles que le débit quotidien, d'inspecter les étiquettes pour en vérifier la qualité et de fournir des commentaires sur les données étiquetées. Ground Truth Plus convient à divers cas d'utilisation, notamment la reconnaissance d'image, le traitement du langage naturel et la reconnaissance vocale.

Q : Pourquoi utiliser Amazon SageMaker Ground Truth Plus ?

Pour entraîner un modèle de machine learning (ML), les scientifiques des données ont besoin de grands jeux de données étiquetées de haute qualité. À mesure que l'adoption du ML se développe, les besoins en matière de labellisation croissent. Les scientifiques des données sont ainsi obligés de consacrer des semaines à la création de flux de travail destinés à l'étiquetage des données et à gérer une main-d'œuvre spécialisée dans ce domaine. Cette approche ralentit malheureusement l'innovation et augmente les coûts. Pour que les scientifiques des données puissent consacrer leur temps à la création, à l'entraînement et au déploiement de modèles de ML, ils chargent généralement d'autres équipes internes, composées de responsables des opérations de données et de responsables de programmes, de produire des jeux de données d'entraînement de haute qualité. Cependant, ces équipes n'ont généralement pas les compétences requises pour fournir des jeux de données d'entraînement de haute qualité, ce qui a un impact sur les résultats du ML.

Amazon SageMaker Ground Truth Plus facilite la création de jeux de données d'entraînement de haute qualité pour les scientifiques des données ainsi que pour les responsables d'entreprise, notamment ceux des opérations de données et des programmes, en supprimant les tâches exigeantes indifférenciées associées à la création d'applications d'étiquetage des données et à la gestion de la main-d'œuvre spécialisée pour l'étiquetage. Tout ce que vous avez à faire, c'est de partager vos données et vos exigences en matière d'étiquetage. Ground Truth Plus met en place et gère votre flux de travail d'étiquetage des données en fonction de ces exigences. À ce stade, une main-d'œuvre experte et entraînée à diverses tâches de ML procède à l'étiquetage des données. Vous n'avez même pas besoin d'une expertise ML approfondie ou une connaissance de la conception des flux et de la gestion de la qualité pour utiliser Ground Truth Plus.

Q : Comment démarrer avec Amazon SageMaker Ground Truth Plus ?

Pour démarrer avec Amazon SageMaker Ground Truth Plus, remplissez le formulaire des exigences relatif au projet. Notre équipe vous contactera pour discuter avec vous de votre projet d'étiquetage des données.

Q : Comment Amazon SageMaker Ground Truth Plus m'aide-t-il à gérer mes jeux de données d'entraînement ?

Amazon SageMaker Ground Truth Plus offre une plus grande transparence dans les opérations d'étiquetage des données et de gestion de la qualité. Par exemple, SageMaker Ground Truth Plus fournit une vue du projet, que vous pouvez utiliser pour surveiller la progression du jeu de données d'entraînement dans différents projets. Par ailleurs, un tableau de bord des métriques vous permet de suivre les métriques détaillées des projets, notamment le débit quotidien. SageMaker Ground Truth Plus fournit également une interface utilisateur à partir de laquelle vous pouvez contrôler la qualité des étiquettes et fournir des commentaires en temps réel. Pour finir, avec le mode streaming, vous pouvez avoir un temps d'exécution des étiquettes le même jour ou la même heure pour certains types de charges de travail.

Q : Comment Amazon SageMaker Ground Truth Plus aide-t-il à accroître la précision de mes jeux de données d'entraînement ?

Ground Truth Plus s'appuie sur plusieurs techniques pour accroître la précision du jeu de données d'entraînement.

  • Techniques de ML : Ground Truth Plus utilise les techniques de ML, notamment l'apprentissage actif, le pré-étiquetage et la validation automatique, qui permettent d'améliorer la qualité du jeu de données en sortie et de réduire les coûts d'étiquetage des données. Un flux d'étiquetage à plusieurs étapes inclut les modèles ML pour l'apprentissage actif. Ces modèles permettent à Ground Truth Plus de réduire les coûts en sélectionnant les éléments à étiqueter, ainsi que de réduire l'effort humain grâce au pré-étiquetage par les modèles ML des données sélectionnées. Ground Truth Plus utilise la validation automatique pour identifier les erreurs potentielles qui sont envoyées pour un cycle supplémentaire de vérification par un humain. Cela améliore significativement la qualité des étiquettes en détectant les erreurs humaines.
  • Interface d'étiquetage intuitive : Ground Truth Plus des fonctions d'aide à l'étiquetage, comme (1) l'instantané, qui permet de prendre un instantané d'un cuboïde 3D imparfait pour couvrir étroitement l'objet enfermant ; et (2) l'auto-segmentation, qui réalise un masque d'objet en quelque quatre clics aux points d'extrémité.

Confidentialité des données

Q : Comment Amazon SageMaker Ground Truth Plus permet-il de protéger mes données ?

Par défaut, Amazon SageMaker Ground Truth Plus chiffre les données stockées au repos ou en transit dans un compartiment Amazon S3. En outre, l'accès à vos données est contrôlé à l'aide d'AWS Identity and Access Management (IAM). Vos données sont stockées dans un compte AWS indépendant, et un compte Amazon S3 est créé pour votre projet. Amazon SageMaker Ground Truth Plus ne stocke pas vos données en dehors de l'environnement AWS créé pour vous, ni n'en effectue des copies. AWS journalise et audite tous les accès à vos données à l'aide de la fonction de journalisation des accès Amazon S3 et d'AWS CloudTrail.

Q : Qui a accès à mon contenu traité et stocké par Amazon SageMaker Ground Truth Plus ?

Les employés autorisés d'AWS et le personnel expert qui étiquettent vos données ont accès à votre contenu traité par Amazon SageMaker Ground Truth Plus. Le personnel expert qui étiquette vos données les affiche et les étiquette par le biais du portail utilisateur sécurisé SageMaker Ground Truth. L'accès au portail utilisateur permet aux employés uniquement d'afficher et d'étiqueter les données, sans pouvoir les modifier ni les supprimer. Votre confiance, votre confidentialité et votre sécurité sont notre principale priorité. Nous implémentons des contrôles techniques et physiques appropriés, notamment le chiffrement au repos et en transit, afin d'empêcher tout accès non autorisé à votre contenu ainsi que sa divulgation non autorisée.

Q : Les entrées de données (images, fichiers texte, vidéos, etc.) traitées par Amazon SageMaker Ground Truth Plus sont-elles stockées, et comment sont-elles utilisées par AWS ?

Amazon SageMaker Ground Truth Plus stocke le contenu brut et traité uniquement pour la durée de votre projet, et supprime le contenu associé à votre projet d'étiquetage des données sur demande. Amazon SageMaker Ground Truth Plus utilise votre contenu exclusivement pour fournir et assurer le service. Amazon SageMaker Ground Truth Plus n'utilise jamais votre contenu ou tout modèle entraîné sur le ledit contenu au profit d'autres clients.

Q : Le contenu traité par Amazon SageMaker Ground Truth Plus est-il déplacé en dehors de la région AWS dans laquelle j'utilise Amazon SageMaker Ground Truth Plus ?

Tout contenu traité par Amazon SageMaker Ground Truth Plus est chiffré et stocké au repos dans la région AWS dans laquelle vous utilisez Amazon SageMaker Ground Truth Plus. Sauf indication contraire de votre part dans les exigences de localisation des données convenues d'un commun accord dans le cadre d'un cahier des charges, votre contenu peut être accessible en dehors de la région AWS dans laquelle il est stocké pour effectuer l'étiquetage.

Q : Puis-je demander la suppression des données (images, fichiers texte, vidéos, etc.) stockées par Amazon SageMaker Ground Truth Plus ?

Oui. Vous pouvez demander la suppression des entrées de données brutes et traitées associées à votre projet d'étiquetage des données en contactant AWS Support.

Q : Suis-je toujours propriétaire de mon contenu traité et stocké par Amazon SageMaker Ground Truth Plus ?

Oui. Vous demeurez propriétaire de votre contenu, et nous n'utiliserons ce dernier qu'avec votre consentement.

Q : Puis-je traiter des informations de santé personnelles (PHI) par le biais d'Amazon SageMaker Ground Truth Plus ?

Non. Pour le moment, Amazon SageMaker Ground Truth Plus n'est pas un service éligible à la loi HIPAA.

Main-d'œuvre

Q : Qu'est-ce qu'une main-d'œuvre experte en Amazon SageMaker Ground Truth Plus ?

Avec Ground Truth Plus, l'étiquetage est géré par une main-d'œuvre diversifiée, flexible, hautement qualifiée et formée en machine learning, capable de répondre à vos besoins variés, notamment la sécurité, la confidentialité et la conformité des données. Cette main-d'œuvre est subdivisée en deux parties. 1/ La main-d'œuvre d'Amazon, composée du personnel recruté et géré par Amazon. Ici, Amazon gère les opérations, la qualité ainsi que les SLA relatifs aux délais d'exécution en votre nom. 2/ La main-d'œuvre des fournisseurs, composée des employés répertoriés dans une liste bien organisée de fournisseurs tiers spécialisés dans les services d'étiquetage des données. Ici, Amazon gère la qualité ainsi que les SLA relatifs aux délais d'exécution en votre nom.

Q : Qui choisit le type de main-d'œuvre qui sera utilisé pour mon projet Amazon SageMaker Ground Truth Plus ?

Vous pouvez choisir le type de main-d'œuvre à utiliser pour votre projet. À moins que vous ne demandiez d'utiliser une main-d'œuvre donnée, nous pouvons utiliser la main-d'œuvre d'Amazon, la main-d'œuvre des fournisseurs ou une combinaison des deux, pour vous aider à répondre aux exigences de qualité, de délai d'exécution et de sécurité de votre projet.

Q : Quels sont les changements que la main-d'œuvre des fournisseurs implémente à la lumière de la COVID-19 et dont je dois être informé ?

Compte tenu de la COVID-19, certains fournisseurs de services ont implémenté une politique de travail à distance pour garantir la santé et la sécurité de leurs employés.

Q : Quelles normes de sécurité la main-d'œuvre des fournisseurs doit-elle respecter ?

Les fournisseurs de services sont tenus d'obtenir la conformité SOC 2 ou la certification ISO 27001 chaque année auprès d'un auditeur indépendant.

Le rapport SOC 2 décrit l'environnement de contrôle du fournisseur de services en fonction des critères de services de confiance de l'American Institute of Certified Public Accountants (AICPA) : sécurité, disponibilité, intégrité du traitement, confidentialité et vie privée.

La certification ISO 27001 s'appuie sur les dispositions de l'Organisation internationale de normalisation (ISO) et de la Commission électrotechnique internationale (IEC), qui énoncent les exigences à suivre pour la mise en place, l'implémentation, la maintenance ainsi que l'amélioration continue d'un système de management de la sécurité de l'information (SMSI).

Outre la validation, auprès d'un organisme indépendant, de la norme SOC 2 ou ISO 27001, les fournisseurs de services doivent maintenir des contrôles de sécurité supplémentaires, décrits ci-dessous, pour garantir la sécurité des données.

Contrôles technologiques :
Les prestataires de services sont tenus d'utiliser le logiciel approprié pour bloquer toute tentative de téléchargement ou de copie de fichiers/données à partir de leur système et d'empêcher tout accès non autorisé à leur système. Ils sont également tenus d'interdire à leur personnel de stocker ou de copier les données relatives aux tâches des clients.

Contrôles de sécurité du réseau :
Le réseau du prestataire de services doit être capable d'empêcher l'accès à distance aux données relatives aux tâches des clients. En outre, les logiciels de partage de fichiers entre pairs sont bloqués sur le réseau du prestataire, et le pare-feu doit être conçu de manière à offrir une haute disponibilité.

Contrôles des employés :
Les prestataires de services sont tenus de faire signer à leurs employés des accords de non-divulgation. Les prestataires de services sont tenus d'adopter des règles strictes pour empêcher toute fuite d'informations, et leurs employés de transmettre des informations par quelque moyen que ce soit : papier, clés USB, téléphones portables ou tout autre média.

Contrôles des accès physiques :
Les fournisseurs de service sont tenus de mettre en place des mesures de contrôle des accès physiques afin d'empêcher tout accès non autorisé à leur site de production. Il peut s'agir de tourniquets avec authentification biométrique, de badges d'identification des employés, etc.

Q : Comment AWS aide la main-d'œuvre des fournisseurs des fournisseurs à respecter ces normes de sécurité ?

AWS exige que les fournisseurs de services fournissent leurs rapports de certification SOC 2 ou ISO 27001 pour pouvoir faire partie de la main-d'œuvre des fournisseurs d'Amazon SageMaker Ground Truth Plus. Les rapports SOC et les certifications ISO d'AWS ne couvrent pas la main-d'œuvre des fournisseurs.

Amazon SageMaker Ground Truth

Questions d'ordre général

Q : Qu’est-ce que Amazon SageMaker Ground Truth ?

Amazon SageMaker Ground Truth vous permet d'étiqueter efficacement et avec précision les jeux de données nécessaires à l'entraînement de systèmes de machine learning. SageMaker Ground Truth peut automatiquement étiqueter une partie du jeu de données en fonction des étiquettes réalisées manuellement par des personnes. Vous pouvez choisir de faire appel à un effectif de plus de 500 000 étiqueteurs sur Amazon Mechanical Turk, à vos propres employés ou à l'un des fournisseurs de service d'étiquetage de données tiers répertoriés sur AWS Marketplace et sélectionnés préalablement par Amazon. SageMaker Ground Truth utilise des algorithmes et des techniques d'expérience utilisateur (UX) innovants pour améliorer la précision de l'étiquetage humain. Au fil du temps, le modèle s'améliore en apprenant continuellement à partir des étiquettes créées par les humains, ce qui permet un étiquetage automatique plus performant.

Q : Qu'est-ce que l'étiquetage des données automatisé ?

L'étiquetage de données automatisé est l'étiquetage des données par machine learning. Amazon SageMaker Ground Truth sélectionne d'abord un échantillon aléatoire de données et l'envoie à des personnes pour qu'il soit étiqueté. Les résultats sont ensuite utilisés pour former un modèle d'étiquetage qui tente d'étiqueter automatiquement un nouvel échantillon de données brutes. Les étiquettes sont validées lorsque le modèle peut étiqueter les données avec un score de confiance égal ou supérieur à un seuil élevé. Lorsque le score de confiance tombe en dessous de ce seuil, les données sont envoyées aux étiqueteurs humains. Certaines des données étiquetées par les humains sont utilisées pour générer un nouvel ensemble de données de formation pour le modèle d'étiquetage. Le modèle est automatiquement reformé pour améliorer sa précision. Ce processus se répète avec chaque échantillon de données brutes à étiqueter. Le modèle d'étiquetage devient de plus en plus capable d'étiqueter automatiquement les données brutes à chaque itération, et moins de données sont ainsi acheminées vers les humains.

Utilisation de Amazon SageMaker Ground Truth

Q : Pourquoi utiliser Amazon SageMaker Ground Truth ?

Avant de créer, d'entraîner et de déployer des modèles de machine learning, vous avez besoin de données. Les modèles réussis reposent sur des données d'entraînement de haute qualité. La collecte et l'étiquetage des jeux de données d'entraînement sont chronophages et demandent beaucoup de travail. Pour créer les jeux de données d'apprentissage, les étiqueteurs humains doivent évaluer un grand nombre d'images ou d'autres types de données, puis identifier et étiqueter des objets particuliers dans chaque type de données. Ces tâches d’étiquetage sont réparties sur de nombreux étiqueteurs humains, ce qui augmente considérablement les frais généraux et les coûts. S'il y a des étiquettes incorrectes, le système apprendra à partir des informations erronées et fera des prédictions inexactes.

Amazon SageMaker Ground Truth résout ce problème en facilitant la réalisation efficace d'un étiquetage de données extrêmement précis à l'aide de données stockées dans Amazon S3, avec une combinaison d'étiquetage de données automatisé et d'étiquetage effectué par des humains.

Q : Comment démarrer avec Amazon SageMaker Ground Truth ?

Amazon SageMaker Ground Truth fournit une expérience gérée dans laquelle vous pouvez configurer une tâche d'étiquetage des données complète en quelques étapes. Pour démarrer avec Amazon SageMaker Ground Truth, connectez-vous à la console de gestion AWS, puis accédez à la console SageMaker. À partir de là, sélectionnez tâches d'étiquetage sous Ground Truth. Vous pouvez créer une tâche d’étiquetage à cet endroit. Tout d'abord, dans le cadre du processus de création d'une tâche d'étiquetage, vous fournissez un pointeur vers le compartiment S3 qui contient votre jeu de données à étiqueter. Ground Truth propose des modèles pour les tâches d'étiquetage courantes dans lesquelles il vous suffit de cliquer sur quelques choix et de fournir des instructions minimales sur la manière d'étiqueter vos données. Vous pouvez également créer votre propre modèle personnalisé. Lors de la dernière étape de la création d'une tâche d'étiquetage, vous sélectionnez l'une des trois options de main-d'œuvre humaine : (1) une main-d'œuvre publique participative, (2) un ensemble de fournisseurs de services tiers d'étiquetage de données sélectionnés, ou (3) vos propres employés. Vous avez également la possibilité d'activer l'étiquetage automatisé des données.

Q : Comment mes ensembles de données de formation sont-ils gérés à l'aide d'Amazon SageMaker Ground Truth ?

Amazon SageMaker Ground Truth gère les métadonnées, les étiquettes associées et une taxonomie de vos étiquettes et de vos jeux de données. Vous pouvez facilement utiliser le kit SDK AWS par le biais d'un bloc-notes SageMaker ou de la console Ground Truth dans la console SageMaker pour interroger et gérer vos jeux de données et vos étiquettes. Reportez-vous à la documentation d'Amazon SageMaker Ground Truth pour plus d'informations.

Q : Comment Amazon SageMaker Ground Truth aide-t-il à accroître la précision de mes jeux de données d'entraînement ?

Amazon SageMaker Ground Truth offre les fonctions ci-dessous pour vous aider à améliorer la précision de l'étiquetage des données effectué par des personnes.

(a) Consolidation d'annotation : elle neutralise les erreurs ou biais de chaque travailleur en envoyant chaque objet de données à plusieurs travailleurs, puis en consolidant leurs réponses (appelées « annotations ») dans une seule étiquette. Elle prend ensuite leurs annotations et les compare à l'aide d'un algorithme de consolidation d'annotation. Cet algorithme détecte d’abord les annotations aberrantes et ne les prend pas en compte. Il effectue ensuite une consolidation pondérée des annotations, en attribuant des pondérations plus élevées aux annotations plus fiables. La sortie est une étiquette unique pour chaque objet.

(b) Meilleures pratiques d’interface d’annotation : Ce sont des fonctionnalités des interfaces d'annotation qui permettent aux travailleurs d'exécuter leurs tâches avec plus de précision. Les travailleurs humains sont sujets à des erreurs et préjugés, et les interfaces bien conçues améliorent leur précision. L'une des meilleures pratiques consiste à afficher de brèves instructions ainsi que des exemples de bonnes et de mauvaises d'étiquette sur un panneau latéral fixe. Une autre meilleure pratique consiste à assombrir la zone située en dehors de la limite du cadre de délimitation lorsque les travaillent dessinent le cadre de délimitation sur une image.

Q : Comment Amazon SageMaker Ground Truth s’assure-t-il que mes données sont protégées et sécurisées ?

Par défaut, Amazon SageMaker Ground Truth chiffre vos données au repos et en transit. En outre, l'accès à vos données peut être contrôlé à l'aide d'AWS Identity and Access Management (IAM). Ground Truth ne stocke ni ne copie pas vos données en dehors de votre environnement AWS, et vos données restent sous votre contrôle. De plus, Ground Truth prend en charge les normes de conformité telles que le règlement général sur la protection des données (RGPD) et fournit des fonctionnalités complètes de journalisation et d'audit à l'aide d'Amazon CloudWatch et d'Amazon CloudTrail. Reportez-vous à la documentation d'Amazon SageMaker Ground Truth pour plus d'informations.

Q : Comment puis-je accéder à une main-d'œuvre humaine à l'aide d'Amazon SageMaker Ground Truth ?

Dans SageMaker Ground Truth, vous pouvez choisir l'une des trois options de main-d'œuvre, à savoir (1) main-d'œuvre publique participative par le biais d'Amazon Mechanical Turk, (2) fournisseurs tiers de services d'étiquetage des données disponibles par l'entremise d'AWS Marketplace et (3) votre propre main-d'œuvre. Reportez-vous à la documentation d'Amazon SageMaker Ground Truth pour plus d'informations.  

Utilisation de fournisseurs de services d'étiquetage des données tiers

Q :   Les fournisseurs de services d'étiquetage des données Amazon SageMaker Ground Truth peuvent-ils traiter les données confidentielles ?

Oui, le fournisseur de services d'étiquetage des données Amazon SageMaker Ground Truth peut traiter les données confidentielles. Le contrat de service standard entre les clients AWS et le fournisseur tiers de services d'étiquetage des données contient des protections de base pour les informations confidentielles. Veuillez lire ces conditions avant de partager des informations confidentielles avec le fournisseur de service. Les conditions se trouvent sur la page répertoriant les fournisseurs de service sur AWS Marketplace.

Q:   Je travaille avec un prestataire de services tiers par l’intermédiaire d’AWS Marketplace. Quels changements les prestataires de services mettent-ils en œuvre à la lumière de COVID-19 dont je dois être informé ?

Compte tenu de l'évolution rapide de l'impact de COVID-19, certains fournisseurs de services ont implémenté une politique de travail à distance temporairement pour garantir la santé et la sécurité de leurs employés. Pendant cette période, les normes de sécurité, notamment la conformité à la norme SOC 2 et les contrôles de sécurité supplémentaires décrits dans les questions fréquentes (FAQ) ci-dessous, peuvent ne pas être applicables aux fournisseurs de services concernés. Les fournisseurs de services concernés ont mis à jour leurs offres AWS Marketplace en conséquence, et ne traiteront pas les données des clients provenant d'environnements de travail à distance sans le consentement explicite des clients.

Q :   Quelles normes de sécurité les fournisseurs de service d'étiquetage des données Amazon SageMaker Ground Truth doivent-ils respecter ?

Les fournisseurs de services d'étiquetage des données sont tenus de se soumettre à la conformité et à la certification SOC 2 tous les ans. Le rapport SOC 2 décrit l'environnement de contrôle du fournisseur de services en fonction des critères de services de confiance de l'American Institute of Certified Public Accountants (AICPA) : sécurité, disponibilité, intégrité du traitement, confidentialité et vie privée.

Outre SOC 2, les fournisseurs de service sont tenus de mettre en place ces contrôles de sécurité supplémentaires afin de protéger les données des clients.

Contrôles technologiques :
Les fournisseurs de service sont tenus d'utiliser le logiciel approprié pour bloquer toute tentative de téléchargement ou de copie de fichiers.données à partir de leur système et d’empêcher tout accès non autorisé à leurs systèmes. Ils sont également tenus d'interdire à leur personnel de stocker ou de copier les données relatives aux tâches du client.

Contrôles de sécurité du réseau :
Le réseau du fournisseur de service doit être capable d’empêcher l’accès à distance aux données relatives aux tâches du client. En outre, les logiciels de partage de fichiers entre pairs sont bloqués sur le réseau du fournisseur, et le pare-feu doit être conçu de manière à offrir une haute disponibilité.

Contrôles des employés :
Les fournisseurs de service sont tenus de faire signer à leurs employés des accords de non-divulgation. Les prestataires de services sont tenus d'adopter des règles strictes pour empêcher toute fuite d'informations, et leurs employés de transmettre des informations par quelque moyen que ce soit : papier, clés USB, téléphones portables ou tout autre média.

Contrôles des accès physiques :
Les fournisseurs de service sont tenus de mettre en place des mesures de contrôle des accès physiques afin d'empêcher tout accès non autorisé à leur site de production. Il peut s’agir de tourniquets avec authentification biométrique, identification de badge d'employé, etc.

Q :   Comment AWS aide-t-il les fournisseurs de service à respecter ces normes de sécurité ?

AWS demande aux fournisseurs de services de fournir leurs rapports de certification SOC 2 pour pouvoir figurer sur Marketplace et confirme :

l'authenticité (si l'auditeur du fournisseur de service est certifié par l'AICPA) ;

la période de rapport (date de validité de la certification SOC 2) ;

le site de production (le site physique où le personnel du fournisseur de service travaillera sur les tâches d'étiquetage Amazon SageMaker Ground Truth).

Q :   Quelle est la fréquence de vérification des normes de sécurité du fournisseur de service ?

Les normes de sécurité de chaque fournisseur de services sont vérifiées tous les ans, afin de s'assurer qu'elles remplissent les exigences obligatoires.

Q : Existe-t-il des exceptions à la vérification AWS ?

Non. Si le fournisseur de services ne respecte pas les normes de sécurité, ses offres sont supprimées d'AWS Marketplace. Les offres sont supprimées dans les 24 heures, et tous les clients actifs en sont informés par e-mail.

Q :   Si le fournisseur de service propose des services d'étiquetage de données via plusieurs sites de production, tous les sites doivent-ils passer par le processus de vérification ?

Oui, tous les sites doivent respecter les normes de sécurité requises.

Q :   Que se passe-t-il en cas de violation de données sur le site de production du fournisseur de services ?

Le fournisseur de services informera AWS et les clients concernés dans les 24 heures suivant la détection d'un accès, d'une collecte, d'une acquisition, d'une utilisation, d'une transmission, d'une divulgation non autorisés, d'une corruption ou d'une perte, réels ou supposés, des informations des clients. Le fournisseur de services devra résoudre rapidement chaque incident de sécurité et fournir à AWS et aux clients concernés des informations écrites sur l'enquête interne.

Tarification et disponibilité

Q : Combien coûte Amazon SageMaker Ground Truth ?

Veuillez vous reporter à la page de tarification de SageMaker Ground Truth pour obtenir les informations de tarification actuelles.

Q : Dans quelles régions AWS le service Amazon SageMaker Ground Truth est-il disponible ?

Le tableau des régions AWS répertorie toutes les régions AWS où Amazon SageMaker Ground Truth est actuellement disponible.

Génération de données de synthèse

Q : Comment puis-je générer des données de synthèse étiquetées ?

Amazon SageMaker Ground Truth peut générer des données de synthèse étiquetées pour vous. Vous spécifiez vos besoins concernant les images de synthèse ou fournissez des ressources 3D et des images de référence, telles que des images de conception assistée par ordinateur (CAO), et les artistes numériques d'AWS créent complètement des images ou utilisent les ressources fournies par le client. Les images générées imitent la pose et le placement des objets, incluent des variantes d'objets ou de scènes et ajoutent éventuellement des inclusions spécifiques, telles que des rayures, des bosses et d'autres altérations, éliminant ainsi le processus fastidieux de collecte de données ou la nécessité d'endommager des pièces pour acquérir des images. SageMaker Ground Truth peut générer pour vous des centaines de milliers d'images de synthèse étiquetées automatiquement, et ce de manière précise.

Q : Pourquoi utiliser des données de synthèses étiquetées ?

Le sourçage de données pour l'entraînement des modèles de machine learning (ML) est chronophage et demande beaucoup de travail. Pour certains types de données, comme les scénarios rares ou très variables, la collecte de données peut être coûteuse, voire impossible. Par exemple, l'identification des défauts de fabrication nécessite une grande quantité d'images. En outre, les modèles ML doivent être entraînés à reconnaître des scénarios qui ne se produisent pas fréquemment, tels que des défauts rares. Pour identifier les défauts rares, les modèles ML ont besoin d'images des défauts, mais comme ces événements sont peu fréquents, ces données sont généralement créées manuellement, ce qui peut nécessiter d'endommager des pièces coûteuses. Au final, les images doivent être étiquetées manuellement.

Grâce à SageMaker Ground Truth, vous pouvez générer des données de synthèse qui sont automatiquement étiquetées, ce qui réduit le temps et les coûts liés à la collecte et à l'étiquetage des données d'entraînement. Vous pouvez ensuite utiliser les données de synthèse pour entraîner des modèles ML dans un large éventail de cas d'utilisation de la vision par ordinateur, comme la détection d'objets, d'anomalies et de défauts.

Q : Comment SageMaker Ground Truth Amazon génère-t-il des données de synthèse étiquetées ?

Il existe un processus en trois étapes pour générer des données de synthèse étiquetées. Tout d'abord, vous fournissez des ressources 3D, des images de référence et/ou des exigences concernant les images. Ensuite, les artistes numériques convertissent ces entrées en ressources 3D, en ajoutant des inclusions telles que des rayures, des bosses et des textures. Enfin, SageMaker Ground Truth génère des images de synthèse et les étiquette automatiquement.

Q : Puis-je utiliser SageMaker Ground Truth pour générer des données de synthèse étiquetées si je ne dispose pas d'images ou de ressources 3D ?

Oui, il existe une bibliothèque de ressources 3D de plus d'un million d'objets, qui peuvent être utilisés pour soutenir la création de données de synthèse pour vous. Vous pouvez également utiliser un petit jeu d'images pré-étiquetées pour créer des jeux de données de synthèse. Si vous disposez d'images de fond ou d'exemples de données dont vous avez besoin, cela peut accélérer la création de données de synthèse très précises.

Tarification d'Amazon SageMaker Ground Truth
En savoir plus sur la tarification d'Amazon SageMaker Data Labeling

Démarrez avec Amazon SageMaker Data Labeling sans engagement initial ni contrat à long terme.

En savoir plus 
Créer un compte AWS
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Commencez à créer dans la console
Commencez à créer dans la console

Commencez à créer avec Amazon SageMaker Data Labeling dans la console de gestion AWS.

Se connecter