Machine Learning para aplicativos de mídia
As diferenças entre Machine Learning, inteligência artificial e aprendizado profundo
O Machine Learning é o uso de algoritmos de aprendizado que criam um modelo de entendimento sobre as relações entre os dados existentes para fazer previsões sobre novos dados. O termo Machine Learning é muitas vezes usado de forma intercambiável com o termo inteligência artificial. No entanto, embora esses termos sejam relacionados, significam na verdade conceitos diferentes.
A inteligência artificial é a capacidade de sentir, aprender, raciocinar, agir e adaptar-se ao mundo real sem programação explícita. De forma geral, ela pode ser definida como qualquer sistema capaz de exibir algum nível de inteligência semelhante à humana.
Assim, se a inteligência artificial é o conceito geral de criação de soluções que permitem que os computadores aprendam e tomem decisões sem instruções humanas explícitas, o Machine Learning é o método usado pelos desenvolvedores para criar essas habilidades.
Aprendizado profundo é o terceiro termo usado com frequência quando se discute o Machine Learning. Ao invés de usar algoritmos matemáticos explícitos, o aprendizado profundo tenta modelar a forma como o cérebro funciona e aprende com sistemas denominados redes neurais.
Conclusão: há várias maneiras de criar um sistema capaz de demonstrar características semelhantes às humanas, com sistemas baseados em regras e sistemas baseados em conhecimento, cada um deles tendo períodos de predominância nas últimas décadas. No entanto, o Machine Learning está profundamente enraizado nas estatísticas. É por isso que você usa ferramentas e serviços de Machine Learning para criar aplicativos e sistemas de inteligência artificial.
INTELIGÊNCIA ARTIFICIAL
Sentir, aprender, raciocinar, agir e adaptar-se ao mundo real sem programação explícita.
MACHINE LEARNING
Métodos computacionais que utilizam algoritmos de aprendizado para criar um modelo com base em dados (nos modos supervisionado, não supervisionado, semissupervisionado ou de reforço).
APRENDIZADO PROFUNDO
Algoritmos inspirados por redes neurais com várias camadas de neurônios que aprendem representações sucessivamente complexas.
O que diferencia o Machine Learning na nuvem?
A combinação de poder computacional massivo, data lakes, segurança, recursos analíticos e sua capacidade de integração com serviços de nuvem está transformando o Machine Learning de uma tecnologia experimental de nicho em um componente básico empresarial essencial.
Hoje, as empresas usam um maior número de ferramentas de Machine Learning para preparar dados para análise, criar e refinar modelos de Machine Learning e aproveitar aplicativos cognitivos para usuários finais, incluindo reconhecimento de voz, análise de imagens e vídeos, oferta de previsões e recomendações e muitas outras soluções inteligentes.
O resultado é que o Machine Learning revela novos insights, descobertas e eficiências nos sistemas, processos e tecnologias de informação que movem os negócios diários. A infraestrutura central subjacente em praticamente todas os empreendimentos empresariais ou criativos pode ser aprimorada pelas tecnologias de Machine Learning para agregar valor ao produto do trabalho e às pessoas e aos processos que interagem com ele.
Isso ocorre cada vez mais em provedores de vídeo para os setores de mídia e entretenimento, empresas de grande porte e setor público. Em todas essas áreas, o Machine Learning pode aumentar o valor do conteúdo de vídeo e criar experiências incríveis para o público.
No caso específico dos provedores de vídeo, as ferramentas de Machine Learning na nuvem podem ser aplicadas em um número imenso de casos e são continuamente desenvolvidas e aprimoradas.
Quais são algumas vantagens do Machine Learning na nuvem para o vídeo?
Os provedores de vídeo modernos têm uma série de dúvidas em comum:
- Quais atores estão em uma cena?
- Quando certas palavras são ditas?
- Quais objetos estão na tela?
- Uma vez que sabemos que esses atores, cenas, palavras e objetos existem, como recuperá-los no momento exato em que precisamos deles?
O Machine Learning na nuvem para vídeo oferece uma forma conveniente de esclarecer todas essas dúvidas. Veja a seguir algumas maneiras de fazer isso.
Arquivos de vídeo pesquisáveis: com os serviços de Machine Learning na nuvem, as equipes de vídeo podem reduzir substancialmente o tempo e os recursos necessários para catalogar, pesquisar e criar ativos baseados em arquivamentos de vídeo. A indexação de conteúdo e a geração de metadados baseadas em Machine Learning podem viabilizar vários aplicativos com benefícios significativos no mundo real.
Por exemplo, muitas emissoras precisam manter arquivamentos gigantescos de conteúdo de vídeo, geralmente provenientes de fontes heterogêneas e, em alguns casos, usando sistemas inconsistentes de marcação de ativos. Com as ferramentas de Machine Learning, é possível eliminar o demorado trabalho manual de marcação de conteúdo para pesquisa e otimizar as bibliotecas de conteúdo de vídeo para permitir pesquisas rápidas e precisas.
Legendas de vídeo automáticas: os metadados de legendas são essenciais para que o vídeo seja útil e acessível para todos os públicos. No entanto, o processo de transcrever ativos de vídeo e produzir e integrar legendas precisas nos vários formatos necessários para assegurar a acessibilidade em diferentes telas e dispositivos pode ser dispendioso e demorado. O tempo e o custo envolvidos tornam-se cada vez mais proibitivos em grande escala, quando é necessário gerar legendas para grandes volumes de conteúdo.
O advento de ferramentas de Machine Learning que podem processar e analisar vídeo na nuvem oferece aos provedores de conteúdo um mecanismo poderoso e escalável para automatizar o processo de criação de legendas. Esses recursos representam uma grande economia de tempo e trabalho para as empresas (por exemplo, provedores de treinamento online) que têm milhares de horas de vídeo e precisam de legendas para cumprir requisitos definidos pelos clientes.
Geração de clipes de vídeo: tradicionalmente, o processo de geração e publicação de clipes de vídeo exigia um fluxo de trabalho manual para identificar conteúdo relevante em vídeos brutos, gerar clipes codificados por tempo e transcodificar, empacotar e distribuir esses clipes para publicação em canais sociais.
Esse processo com muitas etapas e altos níveis de intervenção manual pode causar atrasos e resultar em oportunidades perdidas, especialmente para transmissões de eventos ao vivo. Agora, as ferramentas de Machine Learning podem automatizar as etapas mais importantes do processo para ajudar as emissoras a disponibilizar clipes de alto valor nas telas dos visualizadores praticamente em tempo real, o que é muito mais adequado ao poder das respostas imediatas oferecidas pela mídia social.
Personalização e monetização: para otimizar as oportunidades de receita do streaming de vídeo, os provedores de conteúdo devem equipar sua infraestrutura para fornecer publicidade direcionada a usuários individuais e entregá-la de forma específica para cada visualizador (por exemplo, anúncios personalizados).
Com os fluxos de trabalho de vídeo aprimorados por Machine Learning, os provedores de conteúdo já podem inserir de forma transparente publicidade personalizada baseada em diversos fatores, como o tipo de dispositivo usado pelo visualizador, as informações demográficas sobre o visualizador ou até mesmo as informações sobre o conteúdo que está sendo transmitido. Esse recurso é conhecido como inserção de publicidade com base em conteúdo.
Análises e medições: hoje, os fluxos de trabalho de vídeo conseguem medir e relatar quantidades aparentemente infinitas de informações sobre streams ao vivo e VOD e sobre a infraestrutura subjacente. Dados relacionados à performance de componentes individuais, a processos essenciais e a fluxos de trabalho completos podem ser medidos e usados para notificações em tempo real ou análises de longo prazo.
Para identificar novos insights e descobertas, a aplicação de sistemas de Machine Learning oferece aos provedores de conteúdo novas formas de otimizar cada aspecto do fluxo de trabalho de vídeo, incluindo performance do fluxo de trabalho, uso de recursos de rede, resultados de monetização e muitos outros.
Quais são algumas possíveis aplicações futuras do Machine Learning para vídeo?
Segurança: uma das principais preocupações com a proteção da nuvem é o controle de acesso. Por exemplo, os provedores de vídeo querem evitar a possibilidade de erros de funcionários que possam expor acidentalmente conteúdo privado, como imagens de um blockbuster inédito. Um “guarda de segurança de Machine Learning” poderia proteger contra esses problemas, detectando vazamentos de conteúdo protegido antes que mais alguém perceba.
Direitos sobre o conteúdo: outra dor de cabeça dos provedores de vídeo é quando alguém publica vídeos de conteúdo protegido por direitos autorais online, usando truques que contornam marcas d´água ou filtros de conteúdo como, por exemplo, diminuir a taxa de quadros em um quadro por segundo. Imagine uma solução de Machine Learning que incorpore scripts de estúdios ou conteúdo dos detentores de direitos. Com esses dados, a solução pode varrer a web em busca de novo conteúdo e reconhecer diálogos e áudio que correspondem a um script.
Demonstração em vídeo: Machine Learning in Sports Video
Análises baseadas em quadros: saiba como é fácil identificar e rastrear pessoas em uma cena, criar e expor metadados dessa cena e aproveitar recursos de pesquisa incrivelmente rápidos e inteligentes nessa demonstração que combina os Serviços de mídia elementares AWS e o Amazon Rekognition.