Blog de Amazon Web Services (AWS)

Presentación de la solución de análisis de contenido de AWS

Por Ian Downard, Ingeniero Técnico Marketing para AWS

 

El   Solución de análisis de contenido de AWS   es un motor de búsqueda de vídeo basado en contenido totalmente automatizado. Cuantifica el contenido de vídeo mediante los servicios de IA de AWS para la visión por computadora y el análisis de voz y, a continuación, cataloga los vídeos para que los usuarios puedan explorar las colecciones de vídeos de acuerdo con los criterios de búsqueda especificados. Esta solución proporciona automatización que puede reducir drásticamente la implicación humana necesaria para catalogar archivos de vídeo para la búsqueda.

Esta solución también es útil para ver los conocimientos   Servicios de IA de AWS   generar para su propio contenido de un vistazo y comprender si esos servicios proporcionan suficiente conocimiento de dominio para sus casos de uso.

Con la solución AWS Content Analysis, los usuarios pueden explorar preguntas como:

  • ¿Proporciona Amazon Rekognition etiquetas para los objetos que estoy buscando?
  • ¿Reconoce Amazon Transcribe el discurso de mis vídeos?
  • ¿Amazon Translate interpreta con precisión el discurso transcrito de mis vídeos?

Esta solución procesa vídeos mediante los siguientes servicios de AWS:

Antes de cargar vídeos en la aplicación web AWS Content Analysis, los usuarios pueden seleccionar qué servicios de IA de AWS desea habilitar.

El conjunto completo de servicios seleccionables se muestra en esta tabla:

 

 

Análisis de vídeo

El   Solución de análisis de contenido de AWS   integra los datos generados por esos servicios en visualizaciones interactivas que permiten a los usuarios ver cuadros delimitadores de objetos seleccionados, objetos de levantamiento en líneas de tiempo de vídeo, leer transcripciones generadas automáticamente, generar traducciones y mucho más.

 

 

La fidelidad de los datos recopilados para vídeos mediante esta solución facilita un análisis detallado a nivel granular. El siguiente es un gráfico que muestra la cantidad de datos grabados para una escena de dos minutos en una de mis películas favoritas, The Big Lebowski. Este clip de dos minutos produjo un total de alrededor de 18.000 registros de datos, para dar una perspectiva sobre la cantidad de datos utilizados para catalogar vídeos:

 

 

La solución AWS Content Analysis también puede procesar películas de larga duración. Por ejemplo, la película Amélie, de dos horas de duración, produjo un total de 652.000 registros de datos, como se muestra en el siguiente gráfico:

 

 

Búsqueda de vídeo

Los vídeos se indexan y catalogan en una instancia de Amazon Elasticsearch. Todo lo que ves al analizar vídeos en la GUI se puede buscar utilizando el lenguaje de consulta estándar Elasticsearch, también conocido como   Lucene   . Esta sección proporciona algunos ejemplos de patrones de búsqueda comunes.

 Búsqueda de texto completo

 Texto completo  permiten buscar cualquier dato en el catálogo de vídeos. Por ejemplo, el servicio de detección de celebridades Amazon Rekognition devolverá el

nombres de celebridades detectadas en un video. Puede buscar una celebridad simplemente escribiendo su nombre, como se muestra en estas capturas de pantalla:

 

 

 Buscar datos de alta confianza

A las etiquetas devueltas por Amazon Rekognition se les asigna un valor de confianza que indica qué tan seguro puede estar de que es preciso. Puede utilizar ese valor para filtrar los resultados de las búsquedas. Por ejemplo,  Violencia y confianza: >80  buscará vídeos que contengan violencia con un umbral de confianza del 80% o más alto.

 Buscar datos de operadores individuales

Las búsquedas consultarán todo el catálogo de metadatos en Elasticsearch. Una búsqueda básica de  Violencia  coincidiría con vídeos que contenían etiquetas de «Violencia» de moderación del contenido, pero también coincidiría con vídeos con transcripciones que contengan la palabra «Violencia». Puede restringir su búsqueda solo a resultados de moderación de contenido con nombres de operador, como este:  Operator:content_moderation AND (Nombre:Violencia y confianza: >80)  .

A continuación se muestra una lista completa de nombres de operadores que puede utilizar para filtrar las consultas de búsqueda:

  • etiqueta_detección_etiqueta
  • celebrity_detection
  • moderación content_
  • face_detection
  • face_search
  • transcribir
  • frases clave_
  • entidades

 Buscar conceptos relacionados en varios operadores

Como ejemplo de una búsqueda compuesta que utiliza varios nombres de operadores, esta consulta que devolverá «Violencia» identificada por moderación de contenido y «armas» o «armas» identificadas por detección de etiquetas:  (Operator:content_moderation AND Name:Violencia y confianza: >80) O (Operator:Label_Detection AND (Nombre:Arma O Nombre:Arma o Nombre:Arma))

 

Llevar

El   Solución de análisis de contenido de AWS   ahora está disponible de forma general. Está diseñado para ayudar a las organizaciones que actualmente tienen dificultades con el mantenimiento de grandes colecciones de vídeos a aprovechar el poder de búsqueda para la recuperación de vídeo. Esta solución también puede ayudar a las personas a probar los servicios de IA de AWS con su propio contenido de vídeo para comprender mejor los escenarios a los que se pueden aplicar estos servicios.

Para obtener más información acerca de AWS Content Analysis,   visita la página de la solución   .

 

Este artículo fue traducido del Blog de AWS en Inglés

 

 


Sobre el autor

Ian Downard es Ingeniero Técnico de Marketing para AWS. Se centra en crear formas amigables para los desarrolladores de utilizar los servicios de aprendizaje automático de AWS para procesar multimedia. Le gusta relacionarse con gente en conferencias y grupos de Meetup de tecnología en Portland, Oregon.