Машинное обучение для мультимедийных приложений
Различия между машинным обучением, искусственным интеллектом и глубоким обучением
Машинное обучение означает использование обучающихся алгоритмов, которые выстраивают модель взаимосвязей между существующими данными, чтобы формировать прогнозы относительно новых данных. Термины «машинное обучение» и «искусственный интеллект» зачастую используются как синонимы, хотя на самом деле они относятся к различным, хоть и связанным, понятиям.
Искусственный интеллект – это способность к восприятию, обучению, рассуждению, действию и адаптации к реальному миру без явного программирования. В широком смысле система обладает искусственным интеллектом, если способна проявлять некоторый уровень интеллекта, аналогичного человеческому.
Таким образом, если искусственный интеллект – это общее понятие для систем, которые позволяют компьютерам обучаться и принимать решения без прямых инструкций от человека, то машинное обучение – это метод, с помощью которого разработчики создают такие способности.
Глубокое обучение – это третий из терминов, которые часто используют при обсуждении машинного обучения. При глубоком обучении не используются явные математические алгоритмы, а происходит попытка смоделировать работу мозга: обучение выполняется с помощью систем под названием «нейронные сети».
Вывод. Существует несколько способов построения систем, которые способны демонстрировать характеристики, сходные с человеческими. За последние несколько десятилетий внимание уделялось и системам, основанным на правилах, и системам, основанным на базах знаний. Однако машинное обучение уходит корнями в статистику, поэтому для построения приложений и систем искусственного интеллекта используются инструменты на его основе.
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
Восприятие, обучение, рассуждение, действие и адаптация к реальному миру без явного программирования.
МАШИННОЕ ОБУЧЕНИЕ
Вычислительные методы, которые выстраивают модель данных с помощью обучающихся алгоритмов (в режимах контролируемого, неконтролируемого, частично контролируемого обучения или обучения с подкреплением).
ГЛУБОКОЕ ОБУЧЕНИЕ
Алгоритмы на основе нейронных сетей с несколькими уровнями нейронов, которые изучают представления данных с последовательным усложнением.
Чем отличается машинное обучение в облаке?
Сочетание огромных вычислительных мощностей, озер данных, систем безопасности, аналитических возможностей и возможности интеграции с другими облачными сервисами превращает машинное обучение из узкоспециализированной экспериментальной технологии в важный компонент бизнеса.
Сегодня компании все чаще используют инструменты машинного обучения, чтобы подготавливать данные для анализа, создавать и дорабатывать модели машинного обучения. Они также используют преимущества когнитивных приложений, включая распознавание голоса, анализ изображений и видео, составление прогнозов и рекомендаций, а также множество других интеллектуальных решений.
В результате машинное обучение приводит к новым аналитическим выводам, открытиям и повышению эффективности систем, процессов и информационных технологий, которые ежедневно используются в работе компаний. Основу инфраструктуры любого бизнеса или творческого начинания можно дополнить технологиями машинного обучения, повышая ценность продукта, а также эффективность людей и процессов, которые с ним взаимодействуют.
Это становится все более актуально для поставщиков видео для мультимедийных и развлекательных сервисов, корпоративных и общественных организаций. Во всех этих областях машинное обучение может повысить ценность видеоконтента и оставить у зрителей превосходные впечатления.
Особенное распространение получили приложения для поставщиков видео с использованием машинного обучения в облаке. Такие приложения постоянно разрабатываются и дорабатываются.
Каковы преимущества машинного обучения в облаке для работы с видео?
У современных поставщиков видео часто появляются схожие вопросы.
- Кто из действующих лиц находится в кадре?
- Когда произносятся определенные слова?
- Какие объекты расположены на экране?
- Если мы знаем, что упомянутые актеры, сцены, слова или объекты существуют, как найти их, когда они понадобятся?
Облачные технологии машинного обучения для работы с видео предоставляют удобное решение для каждого из этих вопросов. Вот некоторые из путей решения.
Видеоархивы с возможностью поиска. С помощью сервисов машинного обучения сотрудники, работающие с видео, могут значительно сократить затраты времени и сил на каталогизацию, поиск и построение библиотек из своих видеоархивов. Индексация контента и генерация метаданных с помощью систем машинного обучения открывает значительные преимущества для приложений.
К примеру, многим вещательным организациям необходимо поддерживать огромные архивы видеоконтента, часто из различных источников и с различными, а иногда и просто отсутствующими, системами тегов для контента. Благодаря инструментам машинного обучения можно устранить необходимость трудоемкого создания тегов для контента, а также оптимизировать библиотеки с видеоконтентом для быстрого и точного поиска.
Автоматизированные субтитры. Чтобы видео стало полезным и доступным для всех аудиторий, необходимы метаданные с субтитрами. Однако процесс записи, производства и внедрения точных субтитров в различные форматы для всевозможных устройств и экранов может оказаться дорогим и трудоемким. Когда приходится создавать субтитры для больших объемов контента, требуемое для этого время и затраты становятся непомерно высокими.
Появление инструментов с машинным обучением, способных обрабатывать и анализировать видео в облаке, предоставляет поставщикам контента мощную и масштабируемую возможность автоматизации создания субтитров. Это позволяет значительно сократить расходы времени и трудозатраты для компаний, которым требуется создание субтитров для тысяч часов видеоконтента, например для поставщиков онлайн‑курсов.
Создание видеоклипов. Долгое время создание и публикация видеоклипов требовали ручного рабочего процесса, состоящего из поиска интересующего контента в исходном видео, отметки отрывков временными кодами, перекодировки, упаковки и распространения клипов через публикацию в социальных сетях.
Такая многоступенчатая работа вручную может приводить к задержкам и упущенным возможностям, особенно при вещании в прямом эфире. Теперь же инструменты с машинным обучением могут автоматизировать основные шаги этого процесса и помочь вещательным компаниям показывать зрителям клипы высокого качества практически в режиме реального времени. Это значительно больше подходит для присущей социальным сетям спонтанности.
Индивидуальная настройка и монетизация. Чтобы поставщики контента могли эффективнее использовать возможности получения доходов при видеотрансляциях, их инфраструктура должна распространять рекламу, ориентированную на конкретного пользователя.
С помощью рабочих процессов, дополненных машинным обучением, поставщики контента могут органично встраивать индивидуально настроенную рекламу, основываясь на различных факторах, например демографических сведениях о пользователе, сведениях об используемом устройстве или даже данных о транслируемом контенте. Такой подход называют контентно‑зависимой рекламой.
Аналитика и измерения. Современные процессы работы с видео включают возможность замерять информацию о видеопотоках в прямом эфире и по запросу, а также стоящей за ними инфраструктуре, и передавать нескончаемые отчеты на основе этих данных. Данные о рабочих показателях отдельных компонентов, основных процессов и рабочего процесса в целом могут измеряться и использоваться для оповещений в режиме реального времени или для долгосрочного анализа.
Новые выводы и открытия можно получить, применяя системы машинного обучения. С их помощью поставщики контента могут по‑новому подойти к оптимизации каждого аспекта процесса работы с видео, включая общую производительность, использование сетевых ресурсов, результаты монетизации и многое другое.
Каковы возможные дальнейшие области применения машинного обучения при работе с видео?
Безопасность. Одна из основных проблем с обеспечением безопасности облака – это контроль доступа. К примеру, поставщики видео хотят избежать возможных ошибок сотрудников, из‑за которых закрытый контент, например видеоматериалы из еще не вышедшего блокбастера, может оказаться обнародованным. «Охранник» на основе машинного обучения может предотвратить такие проблемы, обнаружив защищенный контент в открытом доступе до того, как кто‑нибудь его заметит.
Права на контент. Другим поводом для беспокойства поставщиков контента служит публикация контента, защищенного авторским правом, за счет хитрых технологий, убирающих водяные знаки или фильтры контента (в частности, за счет снижения частоты кадров на один кадр в секунду). Представьте себе систему машинного обучения, имеющую в своем распоряжении сценарии от студии или контент от правообладателей. Располагая такими данными, она может обнаруживать новый контент в сети и распознавать диалоги или аудиофайлы, соответствующие сценарию.
Демонстрационное видео: машинное обучение для спортивных видео
Покадровый анализ. Узнайте, как можно легко распознавать и отслеживать людей в кадре, создавать и отображать метаданные по конкретному кадру, а также использовать невероятно быстрые интеллектуальные возможности поиска из этого видео, объединяющего возможности AWS Elemental Media Services и Amazon Rekognition.