Questions d'ordre général

Q : Qu'est-ce qu'Amazon Rekognition ?

Amazon Rekognition est un service simplifiant l'ajout de la puissante analyse virtuelle à vos applications. Rekognition Image vous permet de créer simplement des applications puissantes pour rechercher, vérifier et organiser des millions d'images. Rekognition Video vous permet d'extraire du contexte de mouvement de flux vidéo stockés ou en direct et de l'analyser.

Rekognition Image est un service de reconnaissance d'images qui détecte des objets, des scènes et des visages, extrait du texte, reconnaît les célébrités et identifie le contenu inapproprié d'images. Le service vous permet de rechercher et de comparer des visages. Rekognition Image est basé sur la même technologie éprouvée et hautement évolutive d'apprentissage en profondeur développée par les imagiers d'Amazon pour permettre à Prime Photos d'analyser des milliards d'images chaque jour.

Rekognition Image utilise des modèles de réseaux neuronaux profonds pour détecter et étiqueter des milliers d'objets et de scènes dans vos images, et nous ajoutons sans cesse de nouvelles étiquettes et des fonctions de reconnaissance faciale à ce service. Avec Rekognition Image, vous ne payez que pour les images que vous analysez et les métadonnées de visages que vous stockez.

Rekognition Video est un service de reconnaissance vidéo qui détecte les activités, comprend le mouvement des personnes dans le cadre et reconnaît les objets, les célébrités et le contenu inapproprié dans les vidéos stockées dans Amazon S3 et dans les flux vidéo d'Acuity. Rekognition Video détecte les personnes et les suit tout au long de la vidéo, même si les visages ne sont pas visibles ou lorsque la personne entre et sort de la scène analysée. Par exemple, ce service peut être utilisé avec une application qui envoie en temps réel des notifications lorsque quelqu'un livre un paquet à votre porte. Rekognition Video vous permet d'indexer des métadonnées comme des objets, des activités, des scènes, des célébrités et des visages pour simplifier la recherche vidéo.

Q : Qu'est-ce que l'apprentissage profond ?

L'apprentissage profond est un sous-ensemble de Machine Learning et représente un aspect important de l'intelligence artificielle. Il consiste à déduire des abstractions de haut niveau à partir de données brutes en utilisant un graphe profond avec plusieurs couches de traitement composées de plusieurs transformations linéaires et non linéaires. L'apprentissage profond s'inspire des modèles de traitement des informations et de communication du cerveau. L'apprentissage profond remplace les fonctionnalités créées manuellement par des fonctionnalités issues de vastes quantités de données annotées. L'apprentissage se produit en estimant de façon itérative des centaines de milliers de paramètres dans le graphe profond, grâce à des algorithmes efficaces.

Plusieurs architectures d'apprentissage profond, comme les réseaux de neurones convolutifs profonds (CNN) et les réseaux de neurones récurrents, ont été appliquées à la vision par ordinateur, à la reconnaissance vocale, au traitement automatique de la langue naturelle et à la reconnaissance auditive, pour produire des résultats hors pair sur plusieurs tâches.

Amazon Rekognition fait partie de la gamme de services Amazon AI. Les services Amazon AI utilisent l'apprentissage profond pour comprendre des images, transformer du texte en un discours naturel et créer des textes conversationnels intuitifs et des interfaces vocales.

Q : Ai-je besoin d'être un expert en apprentissage profond pour utiliser Amazon Rekognition ?

Non. Avec Amazon Rekognition, vous n'avez pas besoin de créer, de gérer ou de mettre à niveau des pipelines de deep learning.

Afin d'obtenir des résultats précis pour des tâches de vision par ordinateur complexes telles que la détection d'objets ou de scènes, l'analyse faciale et la reconnaissance faciale, les systèmes d'apprentissage profond doivent être correctement paramétrés et recevoir de très vastes quantités de données de vérité-terrain labellisées. L'approvisionnement, le nettoyage et l'étiquetage précis des données représentent des tâches laborieuses et coûteuses. De plus, la formation d'un réseau DNN est onéreuse en termes de calculs et requiert souvent un équipement construit sur mesure à l'aide d'unités de traitement graphique (GPU).

Amazon Rekognition est une solution entièrement gérée, fournie avec des tâches de reconnaissance des images et des vidéos pré-enregistrées. Par conséquent, vous n'avez pas besoin d'investir votre temps et vos ressources pour créer un pipeline d'apprentissage profond. Amazon Rekognition n'a de cesse d'améliorer la précision de ses modèles, en exploitant les travaux de recherche les plus récents et en recueillant de nouvelles données de formation. Cela vous permet de vous focaliser sur la conception et le développement d'applications à haute valeur ajoutée.

Q. Quels sont les cas d'utilisation les plus courants pour Amazon Rekognition ?

Les cas d'utilisation les plus courants de Rekognition Image incluent :

  • Bibliothèque d'images consultable
  • Vérification de l'utilisateur par le visage
  • Analyse des sentiments
  • Reconnaissance faciale
  • Modération d'images

Les cas d'utilisation les plus courants de Rekognition Video incluent :

  • Index de recherche pour les archives vidéo
  • Filtrage simplifié de contenu explicite et suggestif de vidéos

Q : Comment démarrer avec Amazon Rekognition ?

Si vous n'êtes pas déjà inscrit à Amazon Rekognition, vous pouvez cliquer sur le bouton Essayer Amazon Rekognition sur la page Amazon Rekognition et vous inscrire. Pour ce faire, vous devez disposer d'un compte Amazon Web Services. Si vous n'en avez pas, vous serez invité à en créer un dans le cadre de la procédure d'inscription. Une fois que vous serez inscrit, vous pourrez tester Amazon Rekognition avec vos propres images et vidéos, à l'aide de la console de gestion Amazon Rekognition ou télécharger les kits SDK d'Amazon Rekognition pour commencer à créer vos propres applications. Consultez notre guide de démarrage par étapes pour obtenir davantage d'informations.

Q. Quelles sont les API fournies par Amazon Rekognition ?

Amazon Rekognition Image propose des API permettant de détecter les objets et les scènes, de détecter, d'analyser et de comparer des visages, de reconnaître des célébrités,de détecter du contenu inapproprié et de rechercher des visages similaires dans un répertoire d'images de visages, ainsi que des API de gestion des ressources. Rekognition Image propose également des API pour comparer des visages et extraire du texte alors que Rekognition Video propose des API pour suivre les personnes et gérer les flux vidéo en direct d'Acuity. Pour en savoir plus, consultez la référence API d'Amazon Rekognition.

Q : Quels sont les formats d'image et de vidéo pris en charge par Amazon Rekognition ?

Amazon Rekognition Image prend actuellement en charge les formats d'image JPEG et PNG. Vous pouvez soumettre des images en tant qu'objets S3 ou en tant que tableau d'octets. Les opérations d'Amazon Rekognition Video peuvent analyser des vidéos stockées dans les compartiments Amazon S3. La vidéo doit être encodée avec un codec H.264. Les formats de fichier pris en charge sont MPEG-4 et MOV. Un codec est un logiciel ou un matériel qui compresse des données pour un déploiement plus rapide et décompresse les données reçues dans leur format d'origine. Le codec H.264 est couramment utilisé pour l'enregistrement, la compression et la distribution de contenu vidéo. Un format de fichier vidéo peut contenir un ou plusieurs codecs. Si votre fichier vidéo MOV ou MPEG-4 ne fonctionne pas avec Rekognition Video, vérifiez que le codec vidéo utilisé est bien H.264.

Q : Quelles sont les tailles de fichiers prises en charge par Amazon Rekognition ?

Amazon Rekognition Image prend en charge les fichiers image de 15 Mo maximum lorsque ces derniers sont transformés en objets S3, et de 5 Mo maximum lorsqu'ils sont soumis en tant que tableau d'octets. Amazon Rekognition Video prend en charge des fichiers de 8 Go maximum et des vidéos de 2heures maximum lorsque ces derniers sont transformés en objets S3.

Q : De quelle manière la résolution de l'image affecte-t-elle la qualité des résultats de l'API de Rekognition Image ?

Amazon Rekognition fonctionne sur une vaste gamme de résolutions d'image. Pour obtenir des résultats optimaux, nous vous recommandons d'utiliser la résolution VGA (640 x 480) ou plus. Avec une résolution inférieure à la norme QVGA (320 x 240), les visages ou les objets risquent de ne pas être visibles, bien qu'Amazon Rekognition accepte les images de 80 pixels minimum dans les deux dimensions.

Q. Quelle est la taille minimale des objets détectés et analysés par Amazon Rekognition Image ?

En règle générale, assurez-vous que l'objet ou le visage le plus petit d'une image représente au moins 5 % de la taille (en pixels) de la dimension d'image la moins importante. Par exemple, si vous travaillez sur une image d'une dimension 1 600 x 900, le plus petit objet ou visage doit représenter au moins 45 pixels dans l'une des dimensions.

Q : De quelle manière la résolution de la vidéo affecte-t-elle la qualité des résultats de l'API de Rekognition Video ?

Le système est formé à la reconnaissance de visages supérieurs à 32 pixels (sur la dimension la plus petite), ce qui se traduit par une taille minimale pour un visage reconnaissable allant d'approximativement 1/7 de la plus petite dimension de l'écran avec une résolution QVGA à 1/30 avec une résolution HD 1080p. Par exemple, avec une résolution VGA, les utilisateurs doivent s'attendre à des performances moindres pour les visages inférieurs à 1/10 de la plus petite dimension de l'écran.

Q : Quoi d'autre peut affecter la qualité des API de Rekognition Video ?

Au-delà de la résolution de la vidéo, un flou intense, des personnes se déplaçant rapidement ou encore des conditions orageuses peuvent affecter la qualité des API.

Q : Quel est le contenu vidéo d'utilisateur favori pouvant convenir aux API de Rekognition Video ?

Cette API fonctionne mieux avec les vidéos de professionnels et de consommateurs tirées du champ de vue frontal en couleur et dans des conditions orageuses. Cette API n'est pas testée pour le noir et blanc, l'infrarouge et les conditions orageuses extrêmes. Les applications sensibles aux fausses alertes sont conseillées pour écarter les sorties présentant un score de confiance inférieur au score de confiance sélectionné (propre à l'application).

Q : Dans quelles régions AWS Amazon Rekognition est-il disponible ?

Amazon Rekognition Image est disponible dans les régions AWS suivantes : USA Est (Virginie du Nord), USA Ouest (Oregon), USA Est (Ohio) , UE (Irlande), Asie-Pacifique (Tokyo), Asie-Pacifique (Sydney), Asie-Pacifique (Mumbai), Asie-Pacifique (Séoul) et AWS GovCloud (US). Amazon Rekognition Video est disponible dans les régions AWS suivantes : USA Est (Virginie du Nord), USA Ouest (Oregon), USA Est (Ohio), UE (Irlande), Asie-Pacifique (Tokyo), Asie-Pacifique (Sydney), Asie-Pacifique (Mumbai), Asie-Pacifique (Séoul) et AWS GovCloud (US). Le streaming en temps réel Amazon Rekognition Video est disponible dans les régions AWS suivantes : USA Est (Virginie du Nord), USA Ouest (Oregon), UE (Irlande), Asie-Pacifique (Tokyo), Asie-Pacifique (Mumbai) et Asie-Pacifique (Séoul).

Détection d'objets et de scènes

Q : Qu'est-ce qu'une étiquette ?

Une étiquette est un objet, une scène ou un concept figurant sur une image, sur la base de ses contenus. Par exemple, une photo d'un groupe de personnes sur une plage tropicale peut contenir les étiquettes « Personnes », « Eau », « Sable », « Palmier » et « Maillots de bain » (objets), « Plage » (scène) et « Extérieurs » (concept). 

Q : Qu'est-ce qu'un score de confiance et comment fonctionne-t-il ?

Un score de confiance est un chiffre compris entre 0 et 100 qui indique la probabilité d'exactitude d'une prévision donnée. Dans l'exemple de la plage tropicale, si le processus de détection de l'objet et de la scène renvoie un score de 99 pour l'étiquette « Eau » et de 35 pour l'étiquette « Palmier », cela signifie que l'image représente plus probablement de l'eau qu'un palmier.

Les applications très sensibles aux erreurs de détection (les faux positifs) doivent supprimer les résultats associés à des scores de confiance inférieurs à un certain seuil. Le seuil optimal dépend de l'application. Dans de nombreux cas, vous bénéficierez d'une expérience utilisateur optimale en définissant des valeurs de confiance minimales supérieures à la valeur par défaut.

Q : Qu'est-ce que la détection d'objets et de scènes ?

La détection d'objets et de scènes désigne le processus d'analyse d'une image ou d'une vidéo visant à lui assigner des étiquettes, en fonction de son contenu visuel. Amazon Rekognition Image procède à ces opérations avec l'API DetectLabels. Cette API vous permet d'identifier automatiquement des milliers d'objets, de scènes et de concepts et renvoie un score de confiance pour chaque étiquette. DetectLabels utilise un seuil de confiance par défaut de 50. La détection d'objets et de scènes est idéale pour les clients qui souhaitent effectuer des recherches dans de vastes bibliothèques d'images et les organiser, comme les applications consommateur ou de style de vie qui dépendent de contenus générés par les utilisateurs, et pour les entreprises d'ingénierie publicitaire qui souhaitent améliorer leurs algorithmes de ciblage.

Q : Quels sont les types d'étiquette pris en charge par Amazon Rekognition ?  

Rekognition prend en charge des milliers d'étiquettes associées à des catégories courantes, y compris, mais sans s'y limiter :

  • Personnes et événements : « Mariage », « Mariée », « Bébé », « Gâteau d'anniversaire », « Guitariste », etc.
  • Aliments et boissons : « Pomme », « Sandwich », « Vin », « Gâteau », « Pizza », etc.
  • Nature et extérieurs : « Plage », « Montagnes », « Lac », « Coucher de soleil », « Arc-en-ciel », etc.
  • Animaux et animaux de compagnie : « Chien », « Chat », « Cheval », « Tigre », « Tortue », etc.
  • Maison et jardin : « Lit », « Table », « Cour intérieure », « Chandelier », « Chambre à coucher », etc.
  • Sports et loisirs : « Golf », « Basketball », « Hockey », « Tennis », « Randonnée », etc.
  • Plantes et fleurs : « Rose », « Tulipe », « Palmier », « Forêt », « Bambou », etc.
  • Art et divertissement : « Sculpture », « Peinture », « Guitare », « Ballet », « Mosaïque », etc.
  • Transports et véhicules : « Avion », « Voiture », « Vélo », « Moto », « Camion », etc.
  • Electronique : « Ordinateur », « Téléphone portable », « Caméra », « TV », « Casque », etc.

Q. Qu'est-ce qui diffère dans la détection d'objets et de scènes pour l'analyse vidéo ?

Rekognition Video vous permet d'identifier automatiquement des milliers d'objets (véhicules ou animaux) et d'activités (fêtes ou danse) et vous fournit des horodatages ainsi qu'un score de confiance pour chaque étiquette. Le service repose également sur le mouvement et le contexte temporel de la vidéo pour identifier précisément des activités complexes comme le fait de « souffler sur une bougie » ou « d'éteindre un incendie ».

Q. Je n'arrive pas à trouver l'étiquette dont j'ai besoin. Comment demander une nouvelle étiquette ?

Envoyez-nous vos demandes via le support client AWS. Amazon Rekognition élargit en continu son catalogue d'étiquettes en fonction des commentaires des clients.

Unsafe Content Detection

Q. Qu'est-ce qu'Unsafe Content Detection ?

Unsafe Content Detection d'Amazon Rekognition est une API facile à utiliser basée sur l'apprentissage profond et qui détecte le contenu explicite et suggestif destiné aux adultes dans les images. Les développeurs peuvent utiliser ces métadonnées supplémentaires pour filtrer le contenu inapproprié selon les besoins de leurs activités. En plus de signaler une image suivant la présence de contenu destiné aux adultes, Image Moderation renvoie également une liste hiérarchique d'étiquettes avec des indices de confiance. Ces étiquettes désignent des catégories spécifiques de contenu destiné aux adultes, offrant ainsi aux développeurs un contrôle plus précis pour filtrer et gérer de grands volumes de données de contenu généré par les utilisateurs (CGU). Cette API peut être utilisée dans les flux de travail de modération pour les applications comme les sites de rencontre et les réseaux sociaux, les plates-formes de partage d'images, les blogs et les forums, les applications pour enfants, les sites d'e-commerce, ainsi que les services de divertissement et de publicité en ligne.

Q. Quels sont les types de contenus explicites et suggestifs destinés aux adultes détectés par Amazon Rekognition ?

Amazon Rekognition détecte les types suivants de contenus explicites et suggestifs destinés aux adultes dans les images :

  • Nudité explicite
  • Nudité
  • Nudité masculine
  • Nudité féminine
  • Activité sexuelle
  • Nudité partielle
  • Image suggestive
  • Femme en maillot de bain ou en sous-vêtements
  • Homme en maillot de bain ou en sous-vêtements
  • Vêtements trop peu couvrants

L'API Unsafe Content Detection d'Amazon Rekognition renvoie une hiérarchie d'étiquettes ainsi qu'un score de confiance pour chaque étiquette détectée. Par exemple, en cas d'image inappropriée, Rekognition renverra « nudité explicite » avec un indice de confiance comme étiquette de haut niveau. Les développeurs ont juste à l'utiliser pour signaler le contenu. Dans la même réponse, Rekognition renvoie également un second niveau de granularité en fournissant davantage de contexte, comme « Nudité masculine », avec son propre indice de confiance. Les développeurs peuvent utiliser cette information pour concevoir une logique de filtrage plus complexe.

Veuillez noter que l'API Unsafe Content Detection n'est pas infaillible et ne prétend pas être un filtre exhaustif de contenu explicite et suggestif destiné aux adultes. De plus, cette API ne détecte pas si le contenu de l'image est illégal (comme la pédopornographie) ou s'il s'agit de contenu contrenature destiné aux adultes.

Q. Est-ce que l'API Unsafe Content Detection d'Amazon Rekognition peut détecter d'autres contenus inappropriés que celui explicite et suggestif destiné aux adultes ?

Actuellement, Rekognition prend uniquement en charge les étiquettes indiquées ci-dessus. Nous travaillons sans cesse à l'ajout de nouvelles étiquettes et à l'amélioration de celles qui existent déjà selon les retours de nos clients.
Si vous avez besoin que d'autres types de contenus inappropriés soient détectés dans les images, merci de nous contacter en utilisant le processus de commentaire expliqué plus loin dans cette section.

Q. Qu'est-ce qui diffère dans Unsafe Content Detection pour l'analyse vidéo ?

Rekognition Video vous permet d'identifier automatiquement du contenu explicite ou suggestif pour adulte et vous fournit également des horodatages ainsi qu'un score de confiance pour chaque étiquette de type de contenu.

Q. Comment puis-je m'assurer que Rekognition correspond à mon cas d'utilisation de modération d'images et de vidéos pour adultes ?

Les modèles d'Unsafe Content Detection de Rekognition sont configurés et testés intensément, mais nous vous recommandons d'évaluer leur exactitude sur vos propres ensembles de données pour déterminer leurs performances.

Vous pouvez utiliser le paramètre « MinConfidence » dans vos requêtes d'API pour atteindre un équilibre entre détection de contenu (rappel) et fiabilité de détection (précision). Si vous réduisez « MinConfidence », vous allez probablement détecter plus de contenu inapproprié, mais vous allez également récupérer du contenu qui n'est pas réellement explicite ou suggestif. Si vous augmentez « MinConfidence », tout le contenu détecté sera certainement explicite ou suggestif, mais il est possible que certains contenus inappropriés ne soient pas détectés. Pour des exemples d'utilisation de « MinConfidence » pour les images, consultez la documentation ici.

Si Rekognition ne réussit pas à détecter du contenu destiné aux adultes dans des images ou des vidéos, merci de nous le signaler en utilisant le processus de commentaire ci-dessous.

Q. Comment puis-je faire des commentaires pour améliorer l'API Unsafe Content Detection de Rekognition ?

Envoyez-nous vos demandes via le support client AWS. Amazon Rekognition détecte de plus en plus de types de contenus inappropriés grâce aux commentaires des clients. Il faut compter entre 6 et 8 semaines pour ajouter un nouveau type de contenu explicite et suggestif destiné aux adultes. Veuillez noter que le contenu illégal (comme la pédopornographie) ne sera pas accepté par ce processus.

Analyse faciale

Q : Qu'est-ce que l'analyse faciale ?

L'analyse faciale est le processus de détection d'un visage dans une image et d'extraction de ses attributs faciaux essentiels. Amazon Rekognition Image renvoie la boîte de liaison pour chaque visage détecté dans une image avec des attributs comme le sexe, la présence de lunettes de soleil et les traits caractéristiques du visage. Rekognition Video renverra les visages détectés dans une vidéo avec un horodatage et, pour chaque visage détecté, la position et la boîte de liaison ainsi que les traits caractéristiques du visage.

Q : Quels sont les attributs faciaux pris en charge par Amazon Rekognition ?

Amazon Rekognition renvoie les attributs faciaux suivants pour chaque visage détecté, en plus d'un cadre de délimitation et d'un score de confiance pour chaque attribut :

  • Sexe
  • Sourire
  • Emotions
  • Lunettes de vue
  • Lunettes de soleil
  • Yeux ouverts
  • Bouche ouverte
  • Moustache
  • Barbe
  • Position
  • Qualité
  • Traits caractéristiques du visage

Q. Qu'est-ce que la position du visage ?

La position du visage désigne la rotation d'un visage détecté selon des axes de roulis, de tangage et de lacet. Chacun de ces paramètres est renvoyé en tant qu'angle, compris entre -180 et +180 degrés. La position faciale peut servir à déterminer l'orientation du cadre de délimitation du visage de forme polygone (au lieu de rectangulaire), d'évaluer les déformations, d'établir un suivi précis des visages, etc.

Q. Qu'est-ce que la qualité du visage ?

La qualité du visage désigne la qualité de l'image du visage détecté, établie à l'aide de deux paramètres : la netteté et la luminosité. Ces deux paramètres sont renvoyés sous la forme de valeurs comprises entre 0 et 1. Vous pouvez appliquer un seuil à ces paramètres pour trier les visages nets et bien éclairés. Cela peut être utile pour les applications qui nécessitent des images de visage de haute qualité, par exemple en vue de la comparaison faciale ou de la reconnaissance faciale.

Q: Que sont les traits caractéristiques du visage ?

Les traits caractéristiques du visage désignent un ensemble de points saillants, en général localisés sur les coins, les bords et les points intermédiaires des principaux composants faciaux, tels que les yeux, le nez et la bouche. L'API DetectFaces d'Amazon Rekognition renvoie un ensemble de traits caractéristiques de visage et peut être utilisée pour rogner des visages, fusionner deux visages, appliquer des masques personnalisés pour créer des filtres personnalisés, etc.

Q : Combien de visages est-il possible de détecter dans une image ?

Vous pouvez détecter jusqu'à 100 visages dans une image à l'aide d'Amazon Rekognition.

Q : Qu'est-ce qui diffère dans l'analyse faciale pour l'analyse vidéo ?

Avec Rekognition Video, vous pouvez localiser des visages sur une vidéo et analyser les attributs faciaux, tels qu'un sourire, des yeux ouverts ou une émotion. Rekognition Video renverra les visages détectés avec des horodatages et, pour chaque visage détecté, la position et une boîte de liaison ainsi que des traits caractéristiques comme l'œil gauche ou droit et la commissure gauche ou droite des lèvres. Cette position et les informations de temps peuvent être utilisées pour suivre plus simplement le sentiment d'un utilisateur dans le temps et fournir une fonctionnalité supplémentaire comme des cadres de visage automatiques, des surbrillances et des redimensionnements.

Q : En plus de la résolution vidéo, qu'est-ce qui peut affecter la qualité des API de Rekognition Video ?

En plus de la résolution vidéo, de la qualité et des visages représentatifs, une partie du répertoire de visages à rechercher peut influer. L'utilisation de plusieurs instances faciales par personne avec des variations comme une barbe, des lunettes, des positions (face ou profil) améliorera considérablement les performances. D'une manière générale, les personnes se déplaçant rapidement et les vidéos floues risquent d'engendrer des performances moindres.

Comparaison faciale

Q : Qu'est-ce que la comparaison faciale ?

La comparaison faciale désigne le processus de comparaison d'un visage avec un ou plusieurs autres afin d'en mesurer la similitude. À l'aide de l'API CompareFaces, Amazon Rekognition Image vous permet de déterminer la probabilité que deux images représentent le visage d'une même personne. L'API compare un visage dans l'image d'entrée source avec chaque visage détecté dans l'image d'entrée cible et renvoie un score de similitude pour chaque comparaison. Chaque visage détecté s'accompagne d'un cadre de délimitation et d'un score de confiance. Vous pouvez utiliser la comparaison faciale pour vérifier l'identité d'une personne par rapport à une photo enregistrée dans un fichier de personnel, et ce quasiment en temps réel.

Q : Est-il possible d'utiliser une image source avec plusieurs visages ? 

Oui. Si l'image source contient plusieurs visages, CompareFaces détecte le visage le plus grand et le compare à chaque visage détecté dans l'image cible.

Q : Combien de visages est-il possible de comparer ?

Vous pouvez comparer un visage présent dans l'image source avec 15 visages maximum détectés dans l'image cible.

Reconnaissance faciale

Q : Qu'est-ce que la reconnaissance faciale ?

La reconnaissance faciale est le processus d'identification et de vérification de l'identité d'une personne en recherchant son visage dans un répertoire d'images de visages. Avec la reconnaissance faciale, vous pouvez aisément créer des applications telles qu'une authentification multi-facteurs pour les paiements bancaires, pour l'entrée automatique des employés dans des bâtiments, etc.

Q : Qu'est-ce qu'un répertoire d'images de visages et comment en créer un ?  

Un répertoire d'images de visages est un index de recherche de vecteurs de caractéristiques faciales, que vous détenez et gérez. A l'aide de l'API CreateCollection, vous pouvez facilement créer un répertoire dans une région AWS prise en charge et récupérer un Amazon Resource Name (ARN). Chaque répertoire d'images de visages est doté d'un CollectionId unique qui lui est associé.

Q : Comment ajouter ou supprimer des visages à un répertoire d'images de visages ?

Pour ajouter un visage à un répertoire d'images de visages existant, utilisez l'API IndexFaces. Cette API accepte une image sous la forme d'un objet S3 ou d'un tableau d'octets et ajoute une représentation vectorielle des visages détectés au répertoire d'images de visages. IndexFaces renvoie également un FaceId unique et un cadre de délimitation du visage pour chaque visage ajouté.

Pour supprimer un visage d'un répertoire d'images de visages existant, utilisez l'API DeleteFaces. Cette API agit sur le répertoire d'images de visages qui lui est fourni (à l'aide d'un CollectionId) et supprime les entrées correspondant à la liste des FaceId. Pour en savoir plus sur l'ajout et la suppression de visages, reportez-vous à notre exemple Gestion des répertoires.

Q. Comment rechercher un visage un répertoire d'images de visages ?

Une fois que vous aurez créé un répertoire d'images de visages indexé, vous pourrez y rechercher des visages, en utilisant une image (SearchFaceByImage) ou un FaceId (SearchFaces). Ces API recueillent un visage d'entrée et renvoient un ensemble de visages correspondants, organisés selon des scores de similitude, classés par ordre croissant. Pour en savoir plus, reportez-vous à notre exemple Recherche de visages.

Q. Qu'est-ce qui diffère dans la reconnaissance faciale pour l'analyse vidéo ?

Rekognition Video vous permet d'effectuer des recherches faciales en temps réel par rapport à des répertoires de dizaines de millions de visages. Tout d'abord, créez un répertoire de visages dans lequel vous stockerez des visages, qui sont les représentations vectorielles de caractéristiques faciales. Rekognition recherche ensuite dans le répertoire de visages des visages visuellement semblables à ceux de votre vidéo. Rekognition renverra des scores de confiance pour chaque visage de votre vidéo afin que vous puissiez afficher les correspondances plausibles sur votre application.

Q : En plus de la résolution vidéo, qu'est-ce qui peut affecter la qualité des API vidéo ?

En plus de la résolution vidéo, de la qualité et des visages représentatifs, une partie du répertoire de visages à rechercher peut influer. L'utilisation de plusieurs instances faciales par personne avec des variations comme une barbe, des lunettes, des positions (face ou profil) améliorera considérablement les performances. D'une manière générale, les personnes se déplaçant rapidement risquent de rencontrer un faible rappel. De plus, les vidéos floues peuvent également rencontrer une faible qualité.

Reconnaissance de célébrités

Q. Qu'est-ce que la reconnaissance de célébrités ?

La reconnaissance de célébrité Amazon Rekognition est une API conviviale basée sur l'apprentissage profond permettant de détecter et de reconnaître des personnes célèbres ou notables dans leur domaine. L'API RecognizeCelebrities a été créée pour être utilisée à haut niveau. Elle reconnaît des célébrités d'un grand nombre de domaines, tels que la politique, le Spot, l'économie, le divertissement et les médias. Notre fonction de reconnaissance de célébrité est idéale pour les clients ayant besoin d'indexer et d'effectuer des recherches dans leurs bibliothèques d'images numériques afin de trouver des célébrités dans les domaines qui les intéressent.

Q. Qui est susceptible d'être identifié par l'API de reconnaissance de célébrité ?

Amazon Rekognition ne peut reconnaître que les célébrités que les modèles d'apprentissage profond ont appris à reconnaître. Notez que l'API RecognizeCelebrities n'est pas une autorité en matière de célébrités et n'est pas destinée à en être une liste exhaustive. Le but de cette fonction est d'inclure un maximum de célébrités en fonction des besoins et des commentaires de nos clients. Nous ajoutons de nouveaux noms en permanence, mais le fait que la reconnaissance de clébrité ne reconnaît pas certaines personnes considérées comme notables par d'autres groupes ou par nos clients ne reflète en rien notre opinion sur leur statut de célébrité. Si vous voulez voir d'autres célébrités identifiées par la reconnaissance de célébrité, envoyez-nous un commentaire.

Q. Est-ce qu'une célébrité identifiée par l'API d'Amazon Rekognition peut demander à être retirée de la fonction ?

Oui. Si une célébrité souhaite être retirée de cette fonctionnalité, elle peut envoyer un e-mail au service client d'AWS. Nous nous occuperons de la retirer.

Q. Quelles sont les sources prises en charge fournissant des informations supplémentaires sur les célébrités ?

L'API prend en charge une liste de sources optionnelles afin de fournir des informations supplémentaires sur les célébrités lors de la réponse de l'API. Pour le moment, nous fournissons le lien hypertexte d'IMDB lorsqu'il est disponible. Nous ajouterons peut-être d'autres sources plus tard.

Q. Qu'est-ce qui diffère dans la reconnaissance de célébrités pour l'analyse vidéo ?

Avec Rekognition Video, il est possible de détecter et reconnaître le moment et l'endroit où les personnalités connues apparaissent dans une vidéo. La sortie avec codage temporel comprend le nom et l'identifiant unique de la célébrité, les coordonnées de la boîte de liaison, le score de confiance et les URL renvoyant au contenu lié à la célébrité, par exemple, le lien vers sa page IMDB. La célébrité est également détectée, même si parfois le visage est caché dans la vidéo. Cette fonctionnalité vous permet d'indexer et de rechercher dans des bibliothèques vidéo numériques pour des cas d'utilisation liés à vos besoins multimédia et marketing propres.

Q : En plus de la résolution vidéo, qu'est-ce qui peut affecter la qualité des API de Rekognition Video ?

Les célébrotés se déplaçant rapidement et les vidéos floues peuvent affecter la qualité des API de Rekognition Video. Par ailleurs, une forte quantité de maquillage et un camouflage commun pour les acteurs/actrices peuvent affecter la qualité.

Text in Image

Q : Qu'est-ce que Text in Image ?

Text in Image est une fonctionnalité d'Amazon Rekognition qui vous permet de détecter et reconnaître du texte dans une image comme des noms de rue, des légendes, des noms de produit ou encore des plaques d'immatriculation. La fonction Text in Image est spécialement conçue pour fonctionner avec des images réelles plutôt que des images tirées de documents. L'API DetectText d'Amazon Rekognition prend du texte dans une image et renvoie l'étiquette de texte ainsi qu'une boîte de liaison pour chaque chaîne de caractère détectée et un indice de confiance. Par exemple, dans les applications de réseaux sociaux et de partage d'image, vous pouvez activer la recherche visuelle basée sur un index d'images contenant les mêmes étiquettes de texte. Dans les applications médiatiques et de divertissement, vous pouvez créer des métadonnées de texte pour les cadres vidéo afin de prendre en charge du contenu pertinent, comme des actualités, des résultats sportifs, des publicités et des légendes. Dans les applications de sécurité et de surveillance, vous pouvez identifier des véhicules d'après des numéros d'immatriculation tirés d'images prises par des caméras embarquées ou les radars routiers.

Q : Quel type de texte la fonction Text in Image d'Amazon Rekognition prend-elle en charge ?

La fonction Text in Image est spécialement conçue pour fonctionner avec des images réelles plutôt que des images tirées de documents. Il prend en charge le texte de la plupart des scripts latins et les nombres intégrés dans diverses mises en pages, polices et autres styles, ainsi que le texte superposé à des objets d'arrière-plan dans diverses orientations comme des bannières et des posters. Text in Image reconnaît jusqu'à 50 séquences de caractères par image et les répertorie sous forme de mots et de lignes. De la même manière, Text in Image ne reconnaît que le texte horizontal avec une orientation de +/- 90 degrés.

Q : Comment puis-je faire des commentaires à Rekognition pour améliorer la reconnaissance textuelle ?

Envoyez-nous vos demandes via le support client AWS. Amazon Rekognition reconnaît de plus en plus de types de contenu textuel grâce aux commentaires des clients.

Analyse vidéo

Q. Comment fonctionnent les API asynchrones d'Amazon Rekognition Video ?

Rekognition Video traite une vidéo stockée dans un compartiment Amazon S3. Le modèle de conception est un ensemble asynchrone d'opérations. Vous lancez l'analyse vidéo en appelant une opération de démarrage comme StartLabelDetection. L'état de finalisation de la demande est publié vers une rubrique Amazon Simple Notification Service. Pour récupérer l'état de finalisation de la rubrique Amazon SNS, il est possible d'utiliser une file d'attente Amazon Simple Queue Service. Une fois l'état de finalisation obtenu, il faut appeler une opération de récupération comme GetLabelDetection pour obtenir les résultats de la demande.

 

Q. Qu'est-ce que le suivi des personnes ?

Avec Rekognition Video, vous pouvez suivre chaque personne sur un cliché et sur la vidéo sur plusieurs clichés. Rekognition Video détecte des personnes même lorsque la caméra est en mouvement et renvoie pour chaque personne une boîte de liaison et le visage, ainsi que les attributs faciaux et les horodatages. Pour les applications de vente, cela permet de générer des informations client comme la façon dont les clients se déplacent dans les allées d'un centre commercial ou le temps qu'ils passent à attendre en caisse.

Q. Comment analyser des vidéos en temps réel ?

En mode streaming, vous pouvez rechercher des visages par rapport à un répertoire contenant des dizaines de millions de visages en temps réel. Les API de détection et de reconnaissances faciales de Rekognition Video intègrent de base le flux vidéo provenant d'Amazon Kinesis Video Streams, un service permettant aux développeurs de transmettre des milliers de flux directs et les métadonnées associées. Pour les applications de sécurité, cela simplifie et rend plus précise l'identification en temps réel de suspects potentiels.

Q : Est-ce qu'Amazon Rekognition Video fonctionne avec Amazon Kinesis Video Streams ?

Rekognition Video utilise Kinesis Video Stream comme entrée pour traiter un flux vidéo. Les résultats d'analyse sont des sorties de Rekognition Video vers un flux de données Kinesis et lues par votre application client. Rekognition Video fournit un processeur de flux que vous pouvez utiliser pour démarrer et gérer l'analyse de la diffusion vidéo. Pour en savoir plus, reportez-vous à la section Travailler avec les vidéos en streaming.

Facturation

Q : Comment Amazon Rekognition comptabilise-t-il le nombre d'images traitées ?

Concernant les API qui acceptent les images en tant qu'entrées, Amazon Rekognition comptabilise le nombre réel d'images analysées en tant que nombre d'images traitées. DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities et SearchFaceByImage entrent dans cette catégorie. Concernant l'API CompareFaces, avec laquelle deux images sont recueillies en tant qu'entrées, seule l'image source est comptée comme étant une image traitée.

Concernant les appels d'API qui ne requièrent pas d'image comme paramètre d'entrée, Amazon Rekognition compte chaque appel de l'API comme une image traitée. SearchFaces et ListFaces entrent dans cette catégorie.

Les opérations des autres API d'Amazon Rekognition, DeleteFaces, CreateCollection, DeleteCollection et ListCollections ne sont pas comptabilisées dans les images traitées.

Q : Comment Amazon Rekognition comptabilise-t-il le nombre de minutes de vidéo traitées ?

Pour les vidéos archivées, Amazon Rekognition comptabilise les minutes de vidéo traitées avec succès par l'API et les mesure pour la facturation. Pour les vidéos en flux direct, vous êtes facturé par segments de cinq secondes de vidéo traités avec succès.

Q. Quelles API d'Amazon Rekognition sont payantes ?

Amazon Rekognition Image facture les API suivantes : DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities, SearchFaceByImage, CompareFaces, SearchFaces et ListFaces. Les frais d'Amazon Rekognition Video se basent sur la durée de vidéo en minutes traitées avec succès par les API StartLabelDetection, StartFaceDetection, StartFaceDetection, SatrtContentModeration, StartPersonTracking, StartCelebrityRecognition, StartFaceSerach et StartStreamProcessor.

Q. Combien coûte la solution Amazon Rekognition ?

Consultez la page de tarification d'Amazon Rekognition pour connaître les tarifs à jour.

Q. Serai-je facturé pour les vecteurs de fonction que j'ai stockés dans mes répertoires d'images de visages ?

Oui. Amazon Rekognition facture 0,01 USD par lot de 1 000 vecteurs faciaux par mois. Pour en savoir plus, consultez la page sur la tarification.

Q. Amazon Rekognition fait-il partie de l'offre gratuite AWS ?

Oui. Dans le cadre du niveau d'offre gratuite d'AWS, vous pouvez commencer à utiliser Amazon Rekognition gratuitement. Au moment de leur inscription, les clients d'Amazon Rekognition peuvent analyser jusqu'à 5 000 images gratuitement chaque mois pendant les 12 premiers mois. Vous pouvez utiliser toutes les API d'Amazon Rekognition avec cette offre gratuite, et stocker jusqu'à 1 000 visages gratuitement. En outre, les clients Amazon Rekognition Video peuvent analyser 1 000 minutes de vidéo par mois gratuitement pendant la première année.

Q. Vos prix sont-ils toutes taxes comprises ?

Pour obtenir des informations relatives à la fiscalité, consultez Aide sur les taxes Amazon Web Services.

Intégration à AWS

Q : Amazon Rekognition Video fonctionne-t-il avec les images stockées dans Amazon S3 ?

Oui. Vous pouvez commencer à analyser les images stockées dans Amazon S3 en pointant simplement l'API d'Amazon Rekognition vers votre compartiment S3. Vous n'avez pas besoin de transférer vos données. Pour en savoir plus sur l'utilisation des objets S3 avec les appels d'API d'Amazon Rekognition, reportez-vous à notre exercice Détection des étiquettes.

Q : Puis-je utiliser Amazon Rekognition avec des images stockées dans un compartiment Amazon S3 d'une autre région ?

Non. Assurez-vous que le compartiment Amazon S3 que vous souhaitez utiliser se trouve dans la même région que le point de terminaison de votre API Amazon Rekognition.

Q : Comment traiter plusieurs fichiers image dans un lot avec Amazon Rekognition ?

Vous pouvez traiter vos images Amazon S3 par lot en suivant les étapes indiquées dans notre Exemple de traitement par lot dans Amazon Rekognition sur GitHub.

Q : Comment utiliser AWS Lambda avec Amazon Rekognition ?

Amazon Rekognition fournit un accès en toute transparence à AWS Lambda et vous permet d'intégrer une analyse d'images basée sur des déclencheurs à vos magasins de données, comme Amazon S3 et Amazon DynamoDB. Pour utiliser Amazon Rekognition avec AWS Lambda, veuillez suivre les étapes indiquées ici et sélectionner l'un des plans Amazon Rekognition disponibles.

Q : Est-ce qu'Amazon Rekognition fonctionne sur AWS CloudTrail ?

Oui. Amazon Rekognition prend en charge la journalisation des actions suivantes en tant qu'événements dans les fichiers journaux CloudTrail : CreateCollection, DeleteCollection, CreateStreamProcessor, DeleteStreamProcessor, DescribeStreamProcessor, ListStreamProcessors et ListCollections. Pour en savoir plus sur les appels d'API Amazon Rekognition intégrés à CloudTrail, consultez la section Journalisation des appels d'API Amazon Rekognition avec AWS CloudTrail.

Confidentialité des données

Q. Les entrées image et vidéo traitées par Amazon Rekognition sont-elles stockées par AWS et comment sont-elles utilisées ?

Amazon Rekognition peut stocker et utiliser des entrées image et vidéo stockées par le service uniquement pour fournir et entretenir le service et pour améliorer et développer la qualité d'Amazon Rekognition et d'autres technologies de machine-learning/intelligence artificielle d'Amazon. L'utilisation de votre contenu est nécessaire pour l'amélioration continue de votre expérience client sur Amazon Rekognition, y compris le développement et l'entretien des technologies associées. Nous n'utilisons pas les informations personnellement identifiables qui peuvent être présentes dans votre contenu pour proposer à vos utilisateurs finaux ou à vous-même des produits, des services ou du marketing ciblés. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Consultez https://aws.amazon.com/compliance/data-privacy-faq/ pour en savoir plus.

Q. Puis-je supprimer des entrées image et vidéo stockées par Amazon Rekognition ?

Oui. Vous pouvez demander la suppression des entrées image et vidéo associées à votre compte en contactant AWS Support. La suppression d'entrées image et vidéo peut dégrader votre expérience Amazon Rekognition.

Q : Qui a accès à mon contenu traité et stocké par Amazon Rekognition ?

Seul le personnel autorisé aura accès à votre contenu traité par Amazon Rekognition. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Consultez https://aws.amazon.com/compliance/data-privacy-faq/ pour en savoir plus.

Q : Suis-je toujours propriétaire de mon contenu traité et stocké par Amazon Rekognition ?

Vous restez propriétaire de votre contenu et nous n'utiliserons ce dernier qu'avec votre consentement.

Q : Le contenu traité par Amazon Rekognition est-il déplacé hors de la région AWS dans laquelle j'utilise Amazon Rekognition ?

Tout contenu traité par Amazon Rekognition est chiffré et stocké au repos dans la région AWS dans laquelle vous utilisez Amazon Rekognition. Certaines parties du contenu traité par Amazon Rekognition peuvent être stockées dans une autre région AWS uniquement en lien avec l'effort d'amélioration et de développement continus de votre expérience client Amazon Rekognition et d'autres technologies de machine-learning/intelligence artificielle d'Amazon. Vous pouvez demander la suppression des entrées image et vidéo associées à votre compte en contactant AWS Support. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Consultez https://aws.amazon.com/compliance/data-privacy-faq/ pour en savoir plus.

Q : Puis-je utiliser Amazon Rekognition dans le cadre de sites Web, de programmes ou d'autres applications qui visent les enfants de moins de 13 ans (et qui sont donc concernés par le Children's Online Privacy Protection Act [COPPA]) ?

Oui. Si vous respectez les conditions de service d'Amazon Rekognition, notamment votre obligation de fournir tout avis requis et d'obtenir l'accord parental vérifiable nécessaire selon le COPPA, vous pouvez utiliser Amazon Rekognition dans le cadre de sites Web, de programmes et d'autres applications visant, entièrement ou partiellement, les enfants de moins de 13 ans.

Q : Comment puis-je déterminer si mon site web, mon programme ou mon application est concerné par le COPPA ?

For information about the requirements of COPPA and guidance for determining whether your website, program, or other application is subject to COPPA, please refer directly to the resources provided and maintained by the Federal Trade Commission des États-Unis. Ce site contient également des informations permettant de déterminer si un service vise, entièrement ou partiellement, les enfants de moins de 13 ans.

Q : Le service Amazon Rekognition est-il éligible HIPAA ?

Amazon Rekognition est un service éligible à la norme HIPAA couvert par AWS Business Associate Addendum (AWS BAA). Si vous avez un AWS BAA en vigueur, Amazon Rekognition n'utilisera, divulguera et entretiendra vos données de santé protégées (PHI) que selon ce qu'autorise des termes de votre AWS BAA.

Contrôle d'accès

Q : Comment contrôler l'accès des utilisateurs à Amazon Rekognition ?

Amazon Rekognition est intégré à AWS Identity and Access Management (IAM). Les stratégies AWS IAM peuvent être utilisées afin de s'assurer que seuls les utilisateurs autorisés ont accès aux API d'Amazon Rekognition. Pour en savoir plus, consultez la page Authentification et contrôle d'accès à Amazon Rekognition.

En savoir plus sur la tarification d'Amazon Rekognition

Visiter la page de tarification
Prêt à concevoir ?
Démarrez avec AWS Rekognition
D'autres questions ?
Contactez-nous