Aprendizaje automático para aplicaciones multimedia
Diferencias entre el aprendizaje automático, la inteligencia artificial y el aprendizaje profundo
El aprendizaje automático consiste en el uso de algoritmos de aprendizaje que construyen un modelo de comprensión acerca de las relaciones entre datos existentes, lo que permite predecir nuevos datos. Los términos “aprendizaje automático” e “inteligencia artificial” suelen utilizarse indistintamente; sin embargo, refieren a conceptos que, si bien están relacionados, son independientes.
La inteligencia artificial es la capacidad de sentir, aprender, razonar, actuar y adaptarse al mundo real sin programación explícita. En términos generales, puede definirse como todo sistema capaz de manifestar algún nivel de inteligencia similar a la humana.
Por lo tanto, si la inteligencia artificial se define como el concepto general de crear soluciones que permiten a las computadoras aprender y tomar decisiones sin la instrucción explícita de un humano, el aprendizaje automático es el método por medio del cual los desarrolladores crean esas capacidades.
El aprendizaje profundo es el tercer término que suele utilizarse cuando nos referimos al aprendizaje automático. En lugar de utilizar algoritmos matemáticos explícitos, el aprendizaje profundo busca imitar el modo en el que el cerebro funciona y aprende con sistemas llamados “redes neuronales”.
Aprendizaje: Existen varias maneras de construir un sistema que sea capaz de presentar características similares a las de los humanos. Los sistemas basados en reglas y los sistemas de conocimiento tuvieron su momento de gloria en las últimas décadas. Sin embargo, el aprendizaje automático está profundamente arraigado en las estadísticas, lo que explica por qué usted utilizaría herramientas y servicios de aprendizaje automático para construir aplicaciones y sistemas de inteligencia artificial.
INTELIGENCIA ARTIFICIAL
Sentir, aprender, razonar, actuar y adaptarse al mundo real sin programación explícita.
APRENDIZAJE AUTOMÁTICO
Métodos computacionales que utilizan algoritmos de aprendizaje para construir un modelo a partir de datos (de modo supervisado, sin supervisión, con supervisión parcial o por refuerzo).
APRENDIZAJE PROFUNDO
Algoritmos inspirados en redes neuronales con varias capas de neuronas que aprenden representaciones cada vez más complejas.
¿En qué se diferencia el aprendizaje automático en la nube?
La combinación de la potencia de cómputo masiva, los lagos de datos, la seguridad, las capacidades de análisis y la habilidad para integrarse con los servicios en la nube está transformando el aprendizaje automático de una tecnología de nicho y experimental a un bloque de creación de negocios fundamental.
Hoy en día, las empresas utilizan muchas más herramientas de aprendizaje automático a fin de preparar los datos para el análisis, crear y mejorar modelos de aprendizaje automático y beneficiarse de las aplicaciones cognitivas de los usuarios finales, entre las que se incluyen el reconocimiento de voz, el análisis de imágenes y videos, el ofrecimiento de previsiones y recomendaciones, y muchas otras soluciones inteligentes.
En consecuencia, el aprendizaje automático revela información, eficiencias y descubrimientos nuevos de los sistemas, procesos y tecnologías de la información que impulsan el trabajo diario. La infraestructura central que subyace en prácticamente todos los esfuerzos creativos o de negocios puede mejorarse con el uso de tecnologías de aprendizaje automático que agregan valor al producto del trabajo y a las personas y procesos que interactúan con este.
Esto aplica aún más para los proveedores de videos del sector multimedia y de entretenimiento, las empresas y el sector público, todos sectores en los que con el aprendizaje automático se puede aumentar el valor del contenido de los videos y crear experiencias de audiencia extraordinarias.
Especialmente para los proveedores de videos, existe una gran variedad de aplicaciones para herramientas de aprendizaje automático en la nube que pueden implementarse en los videos y que están en constante desarrollo y mejora.
¿Cuáles son algunas de las ventajas que el aprendizaje automático en la nube aporta a los videos?
Los proveedores de videos modernos tienen muchas preguntas en común:
- ¿Qué actores están en una escena?
- ¿Cuándo se pronuncian determinadas palabras?
- ¿Qué objetos hay en la pantalla?
- Una vez que sabemos que dichos actores, escenas, palabras u objetos existen, ¿cómo hacemos para recuperarlos precisamente cuando los necesitamos?
El aprendizaje automático para video en la nube ofrece una manera muy conveniente de responder a cada una de estas preguntas. A continuación, se incluyen algunos ejemplos.
Archivos de videos que admiten búsquedas. Con los servicios de aprendizaje automático en la nube, los equipos de video pueden reducir sustancialmente el tiempo y los recursos invertidos en catalogar, buscar y crear recursos en sus archivos de video. Con la indexación de contenido impulsada por el aprendizaje automático y la generación de metadatos, se pueden habilitar varias aplicaciones con beneficios reales y significativos.
Por ejemplo, muchas emisoras deben conservar archivos masivos de contenido de video, usualmente creados a partir de diferentes recursos y en los que se utilizan sistemas incoherentes (si se utiliza algún sistema) para el etiquetado de recursos. Con las herramientas de aprendizaje automático, puede eliminarse el lento trabajo manual de etiquetado de contenido para la búsqueda, y pueden optimizarse las bibliotecas de contenido de video a fin de lograr búsquedas rápidas y precisas.
Subtítulos de video automáticos. Los metadatos de los subtítulos son fundamentales para que los videos sean útiles y la audiencia pueda acceder a ellos. No obstante, puede ser costoso y lento transcribir recursos de video, y producir e integrar subtítulos precisos en los diferentes formatos que se requieren para asegurar el acceso en las distintas pantallas y dispositivos. El tiempo y la inversión implicados se vuelven cada vez más prohibitivos a gran escala, cuando se requiere generar subtítulos para grandes volúmenes de contenido.
Con la introducción de las herramientas de aprendizaje automático que pueden procesar y analizar video en la nube, los proveedores de contenido cuentan con un proceso eficiente y escalable para automatizar la creación de subtítulos. Se trata de un método importante con el que las empresas (como los proveedores de formación técnica online) ahorran tiempo y mano de obra. En estas empresas se procesan miles de horas de video, y es necesario que los subtítulos cumplan los requisitos de accesibilidad que establecen los clientes.
Generación de videoclip. Tradicionalmente, el proceso de generar y publicar videoclips ha requerido un flujo de trabajo manual para poder identificar el contenido relevante del video sin procesar, generar clips con tiempo codificado, luego transcodificar, empaquetar y distribuir esos clips para su publicación en las redes sociales.
En este proceso personalizado de varios pasos, se pueden producir demoras y, a causa de estas, se pueden perder oportunidades, en particular en las transmisiones de eventos en directo. Ahora, las herramientas de aprendizaje automático pueden automatizar los pasos clave del proceso para ayudar a las emisoras a entregar clips de gran valor en las pantallas de los espectadores casi en tiempo real. Esto se adecua más a la potencia de la inmediatez de las redes sociales.
Personalización y monetización. A fin de optimizar las oportunidades de ingresos para transmitir video, los proveedores de contenido deben equipar la infraestructura para poder suministrar publicidad que se oriente a los usuarios individuales y se entregue de modo que se adapte a cada espectador, por ejemplo, mediante anuncios personalizados.
Por medio de los flujos de trabajo de video mejorados con el aprendizaje automático, los proveedores de contenido ahora pueden insertar publicidad personalizada sin problemas en función de varios factores, como el tipo de dispositivo que utiliza el espectador, su información demográfica e incluso información del contenido que se transmite. Esto se conoce como “inserción de publicidad con reconocimiento de contenido”.
Análisis y mediciones. Los flujos de trabajo actuales tienen la capacidad de medir e informar cantidades aparentemente infinitas de información sobre las transmisiones en directo y de video bajo demanda, así como la infraestructura detrás de ellas. Los datos relacionados con el rendimiento de los componentes, los procesos clave y los flujos de trabajo completos pueden medirse y utilizarse para notificaciones en tiempo real o análisis a largo plazo.
A fin de identificar información y descubrimientos nuevos, la aplicación de sistemas de aprendizaje automático ofrece a los proveedores de contenido nuevas maneras de optimizar cada aspecto del flujo de trabajo de video, incluidos el rendimiento de ese flujo, el uso de los recursos de red, los resultados de monetización, y mucho más.
¿Cuáles son algunas posibles aplicaciones de video de aprendizaje automático del futuro?
Seguridad. Una de las principales preocupaciones relativas a la protección de la nube es el control de acceso. Por ejemplo, los proveedores de video quieren evitar la posibilidad de que los empleados cometan errores que podrían exponer por accidente contenido privado, como las imágenes de un éxito que no se estrenó. Con un “guardia de seguridad de aprendizaje automático”, se podría brindar protección contra esos problemas mediante la detección de contenido protegido de libre circulación antes de que alguien lo note.
Derechos de contenido. Otro dolor de cabeza para los proveedores de video surge cuando alguien publica online videos de contenido protegido por derechos de autor con trucos que evitan las marcas de agua o los filtros de contenido, por ejemplo, que reducen la velocidad de los cuadros a uno por segundo. Imagine una solución de aprendizaje automático que tenga contenido de scripts de estudio o titulares de derechos cargados en ella. Con estos datos, la solución puede escanear la Web en busca de contenido nuevo y reconocer diálogos y audio que coincidan con un script.
Demostración de video: Aprendizaje automático en video deportivo
Análisis basado en cuadros. Aprenda a identificar y realizar un seguimiento de manera sencilla de las personas en una escena, crear y exponer metadatos de esa escena y aprovechar las capacidades de búsqueda increíblemente rápidas e inteligentes en esta demostración que se corresponde con los servicios multimedia AWS Elemental y Amazon Rekognition.