Publié le: Jun 23, 2020
Amazon Rekognition Video est un service à technologie machine learning (ML) qui permet d'analyser les vidéos pour détecter des objets, des personnes, des visages, du texte, des scènes et des activités, ainsi que pour détecter tout contenu inapproprié. Grâce aux API entièrement gérées et optimisées par ML d'Amazon Rekognition Video, vous pouvez, à compter d'aujourd'hui, automatiser quatre tâches courantes d'analyse des médias, notamment la détection d'images noires, la détection de génériques de fin, la détection de changements de plans et la détection de barres de couleur.
En utilisant ces fonctions, vous pouvez exécuter des flux de travail tels que la préparation du contenu, l'insertion de publicités et l'ajout de « marqueurs en rafale » au contenu à l'échelle du cloud. Les vidéos contiennent en général de brèves séquences d'images noires vides sans aucun son pour délimiter les emplacements d'insertion des publicités ou la fin d'une scène. Amazon Rekognition Video vous permet de détecter de telles séquences afin d'automatiser l'insertion de publicités ou de contenus de paquets pour la vidéo à la demande (VOD) en supprimant les segments indésirables. Vous pouvez ensuite mettre en place des invites interactives telles que « Prochain épisode » dans les applications de vidéo à la demande, en identifiant les images exactes où le générique de fin commence et se termine dans une vidéo. Amazon Rekognition Video vous permet également de détecter les changements de plans, en particulier lorsqu'une scène passe d'une caméra à l'autre. Ces informations vous permettent de créer des vidéos promotionnelles à partir de plans sélectionnés, de générer des vignettes de prévisualisation de haute qualité en choisissant des images clés dans les plans, et d'insérer des publicités sans perturber l'expérience du spectateur, par exemple en évitant le milieu d'un plan lorsque quelqu'un parle. Vous pouvez, enfin, détecter les sections de vidéo qui affichent des barres de couleur SMPTE (Society of Motion Picture and Television Engineers) afin de les supprimer du contenu de la VOD ou pour détecter des problèmes tels que la perte de signaux de diffusion dans un enregistrement, lorsque les barres de couleur peuvent être affichées en continu comme signal par défaut.
Grâce à ces API, vous pouvez, sans avoir besoin d'une quelconque expérience en machine learning, facilement analyser de grands volumes de vidéos stockées dans Amazon S3 et obtenir des codes temporels et des horodatages SMPTE pour chaque détection. Les codes temporels SMPTE renvoyés sont précis à l'image près, ce qui signifie qu'Amazon Rekognition Video fournit le numéro exact de l'image lorsqu'il détecte un segment pertinent de la vidéo, et gère également divers formats de fréquence d'images vidéo, notamment les images perdues et les fréquences d'images fractionnaires sous le capot. En utilisant les métadonnées précises de l'image issue d'Amazon Rekognition Video, vous pouvez soit automatiser complètement les tâches opérationnelles, soit réduire considérablement la charge de travail de vérification par des opérateurs humains formés. Vous pouvez ainsi exécuter des flux de travail d'analyse des médias à grande échelle dans le cloud. Vous ne payez que pour les minutes de vidéo que vous analysez. Il n'y a pas de frais minimums et pas de licences. De plus, aucun engagement initial n'est requis.
Les fonctions d'analyse des médias pour Amazon Rekognition Video sont dorénavant disponibles dans toutes les régions AWS prises en charge par Amazon Rekognition. Pour démarrer, veuillez visiter la page Web du produit, lire notre blog, consulter notre documentation, et télécharger le dernier kit AWS SDK. Pour essayer ces fonctions avec vos vidéos, vous pouvez utiliser le Media Insights Engine.