Publié le: Feb 17, 2020

Amazon Rekognition est un service d'analyse d'image et de vidéo basé sur le deep learning, qui peut identifier des objets, des personnes, du texte, des scènes, et qui prend également en charge la modération de contenu en identifiant tout contenu inapproprié. À compter d'aujourd'hui, vous pouvez détecter du texte dans les vidéos et connaître la fiabilité de la détection, l'emplacement du cadre de délimitation, ainsi que l'horodatage de chaque occurrence de détection de texte. Par ailleurs, la détection de texte à la fois dans les images et les vidéos offre désormais des options pratiques permettant de filtrer les mots par région d'intérêt, taille du cadre de délimitation ou score de fiabilité du mot.  

La détection de texte dans les vidéos peut être mise à profit dans de nombreux cas d'utilisation, en particulier dans les applications multimédias et de divertissement. Pour commencer, vous pouvez rechercher des vidéos ou des horodatages de vidéos où certains mots-clés apparaissent à l'écran, comme « Flash info », par exemple. Ensuite, pour internationaliser un contenu, vous pouvez rapidement rechercher toutes les instances de texte sur la chronologie vidéo d'un programme pour les remplacer par du texte dans une autre langue. Puis, dans les cas d'utilisation liés à la conformité et à la modération, vous pouvez détecter la présence d'erreurs dans le texte, comme des sous-titres intégrés ou des textes contenant des injures ou des propos haineux, par exemple, en vérifiant les mots dans un dictionnaire répertoriant les termes et phrases interdits. Enfin, vous pouvez utiliser l'emplacement du cadre de délimitation pour étudier l'impact de la taille et de l'emplacement du texte sur les performances d'une campagne marketing, ou pour positionner correctement d'autres éléments graphiques. 

Le filtrage par région, taille et score de fiabilité du texte vous offre encore plus de souplesse pour contrôler ce que donne la détection de votre texte. Grâce aux régions d'intérêt, vous pouvez aisément délimiter la détection de texte aux seules régions qui vous intéressent, comme une région tierce dans la partie inférieure des graphiques affichés à l'écran ou un panneau dans le coin supérieur gauche indiquant le score pour un match de foot, par exemple. Il est possible d'utiliser un filtre pour la taille du cadre de délimitation d'un mot, afin d'éviter l'apparition de texte de petite taille gênant ou non pertinent en arrière-plan. Pour finir, le filtre de fiabilité des mots vous permet de supprimer les résultats non fiables car flous ou illisibles. 

Les options de détection de texte dans les vidéos et de filtrage de texte sont désormais disponibles dans toutes les régions AWS prises en charge par Amazon Rekognition. Pour commencer, vous pouvez télécharger le dernier kit SDK AWS et vous reporter à notre documentation pour en savoir plus.