Publié le: Nov 21, 2017

Amazon Rekognition annonce aujourd'hui le lancement de trois nouvelles fonctionnalités : détection et reconnaissance de texte dans des images ; reconnaissance faciale en temps réel parmi des dizaines de millions de visages ; détection de jusqu'à 100 visages dans des photos représentant de nombreuses personnes. Les clients qui utilisent déjà Amazon Rekognition pour la vérification et l'identification faciale apprécieront le niveau de précision amélioré (jusqu'à 10 % en plus) dans la plupart des cas. 

Text in Image : Les clients qui utilisent Amazon Rekognition pour détecter des objets et des visages dans les images nous demandaient depuis longtemps de faire en sorte que le texte intégré dans les images soit également reconnu (par exemple, les noms de rue et les plaques d'immatriculation capturés par les caméras de surveillance du trafic, les titres et bandeaux affichés sur les écrans de télé, ou encore les citations personnalisées ajoutées sur des photos de famille prises avec un téléphone portable). À compter d'aujourd'hui, la fonction Text in Image de Rekognition est capable de reconnaître et d'extraire le texte présent dans les images. La fonction Text in Image est spécialement conçue pour fonctionner avec des images réelles plutôt que des images tirées de documents. Elle prend en charge la plupart des chiffres et alphabets latins, dans un grand nombre de mises en forme, polices et styles, y compris lorsque le texte est superposé à des objets d'arrière-plan selon différentes orientations sous la forme de bannières et d'affiches.

Par exemple, dans les applications de partage d'images et de réseaux sociaux, vous pouvez désormais activer la recherche visuelle sur la base d'un index d'images contenant les mêmes mots-clés. Dans les applications de médias et de divertissement, vous pouvez cataloguer les vidéos en fonction du texte qui vous intéresse à l'écran, notamment les publicités, les actualités, les résultats sportifs ou encore les sous-titres. Enfin, dans les applications de sécurité, vous pouvez identifier des véhicules à partir de leur numéro d'immatriculation, grâce aux images prises par les caméras de surveillance urbaines.

« En tant que plateforme axée sur le visuel, Pinterest dépend énormément de la rapidité et la qualité des images ; mais le texte associé à ces images est tout aussi important, puisqu'il donne du contexte et permet à nos plus de 200 millions d'utilisateurs de mémoriser ce qui leur plaît à l'aide d'épingles. En intégrant la fonction Text in Image d'Amazon Rekognition, nous parvenons à mieux extraire le texte enrichi capturé dans les images à grande échelle, et ce, avec une faible latence pour les millions d'épingles stockées dans Amazon S3. Nous sommes impatients de continuer à développer notre partenariat avec AWS pour offrir une qualité et une rapidité optimales aux utilisateurs de Pinterest comme aux professionnels qui possèdent leur page sur le site. » - Vanja Josifovski, directeur technique, Pinterest

« Bien souvent, les photographes professionnels passent par SmugMug pour partager et vendre des photos contenant du texte. C'est notamment le cas avec les numéros inscrits sur les dossards de course. La fonction Text in Image d'Amazon Rekognition nous permet d'extraire les numéros de dossard à grande échelle via un programme et de proposer aux photographes des fonctionnalités avancées qui leur permettent de partager et de vendre rapidement leurs clichés de ce genre de manifestation sportive. » - Don MacAskill, cofondateur, directeur général et responsable technique chez SmugMug
 

Face Search et Face Detection : Avec Amazon Rekognition, il est maintenant possible de rechercher des visages en temps réel parmi une collection de dizaines de millions de visages. Cela représente des temps de latence 5 à 10 fois plus courts pour les recherches, tout en prenant en charge des collections pouvant contenir 10 à 20 fois plus de visages qu'avant.

Dans les applications de sécurité, il est désormais possible d'identifier des personnes précises par rapport à une collection de millions de visages quasiment en temps réel, par exemple dans le cadre de la prévention de la délinquance. Le bureau du shérif du comté de Washington est le premier à répondre aux appels d'urgence passés par les citoyens de l'Oregon. Le bureau intervient également en renfort d'autres services de police à travers le comté pour lutter contre le crime. Le bureau du shérif avait déjà utilisé Amazon Rekognition pour réduire le délai d'identification des suspects, passé de 2 à 3 jours à quelques minutes seulement.

« Grâce aux nouvelles améliorations, les agents sur le terrain peuvent recevoir une réponse à leur recherche quasiment en temps réel. Ainsi, ils ont très rapidement accès aux informations dont ils ont besoin et ils peuvent agir sans attendre. Sur le terrain, quelques secondes de gagnées, ça peut être une vie de sauvée. » Chris Adzima, analyste senior des systèmes d'information pour le bureau du shérif du comté de Washington.

À partir de maintenant, les clients peuvent également détecter, analyser et indexer jusqu'à 100 visages (contre 15 auparavant) sur une seule et même image. Une telle amélioration permet de capturer précisément des données démographiques et d'analyser les sentiments visibles sur tous les visages d'une photo de groupe, lors d'une grande manifestation ou dans un lieu public comme un aéroport ou un centre commercial.
 

Pour commencer à utiliser les fonctions Text in Image, Face Search et Face Detection, téléchargez le dernier kit SDK ou connectez-vous simplement à la console Amazon Rekognition pour tester ces fonctionnalités sur les images proposées en exemple ou sur vos propres photos. Pour en savoir plus, consultez la documentation d'Amazon Rekognition qui traite des fonctions de texte dans l'image et de détection et recherche de visages.