适用于媒体应用程序的机器学习

机器学习、人工智能和深度学习之间的区别

机器学习是指使用学习算法建立一个模型来理解现有数据之间的关系,从而对新数据做出预测。术语“机器学习”经常与“人工智能”互换使用,但事实上,这两个术语指的是相关但独立的概念。

人工智能是一种无需显式编程就能感知、学习、推理、操作和适应现实世界的能力 – 广义上,它可以被定义为任何能够展示某种程度的类人智能的系统。

因此,如果人工智能是构建解决方案的总体概念,使计算机能够在没有明确的人类指令的情况下学习和决策,那么机器学习就是开发人员创建这些能力的方法。

深度学习是讨论机器学习时经常使用的第三个术语。深度学习不是使用明确的数学算法,而是试图使用所谓的神经网络系统来模拟大脑的工作和学习方式。

结论:有多种方法可以构建一个能够展示类人特征的系统,其中基于规则的系统和基于知识的系统在过去几十年都有很好的展现。但机器学习深深植根于统计学,这就是为什么您会使用机器学习工具和服务来构建人工智能应用程序和系统。

人工智能

无需显式编程,即可感知、学习、推理、操作和适应现实世界。

机器学习

使用学习算法基于数据(在监督、无监督、半监督或强化模式下)构建模型的计算方法。

深度学习

算法的灵感来自具有多层神经元的神经网络,该神经网络可以学习连续复杂的表示。 

云机器学习有何不同?

大规模计算能力、数据湖、安全性、分析能力及其与云服务集成的能力的结合,将机器学习从一项利基的实验性技术转变为一个必不可少的商业构建模块。

如今,越来越多的公司使用机器学习工具来准备用于分析、构建和完善机器学习模型的数据,并利用最终用户认知应用程序,包括语音识别、图像和视频分析,从而提供预测和建议,以及许多其他智能解决方案。

因此,机器学习揭示了驱动日常业务的系统、流程和信息技术的新见解、新发现和效率。承载几乎所有业务或创造性工作的核心基础设施都可以通过机器学习技术得以增强,从而为工作产品、与之交互的人员和相关流程增值。

对于媒体和娱乐、企业和公共部门的视频提供商来说,他们越来越确定这一观点的正确性。在所有这些领域,机器学习都可以增加视频内容的价值,并创造出色的观众体验。

特别是对于视频提供商来说,云机器学习工具在视频领域的应用十分广泛,并且在不断的开发和完善。

云机器学习可以为视频带来哪些优势?

现代视频供应商有许多共同的问题:

  • 视频场景中有哪些演员?
  • 什么时候说某些台词?
  • 屏幕上有什么对象?
  • 一旦我们知道上述演员/场景/台词/对象存在,我们如何在需要时精确地检索它们?

云视频机器学习提供了一种方便的方法来回答每个问题。以下是几个实现方法。

可搜索的视频存档:使用云机器学习服务,视频团队可以显著减少从其视频存档中编目、搜索和构建资产所花费的时间和资源。机器学习支持的内容索引和元数据生成可以为许多应用程序带来显著的实际优势。

例如,许多广播公司必须维护大量的视频内容存档,这些视频内容通常源自不同的来源,并且使用不一致的系统(如果有)来标记资产。使用机器学习工具,可以消除标记搜索内容的耗时人工操作,并且可以优化视频内容库以实现快速、准确的搜索。

自动视频字幕:字幕元数据对于使视频对所有观众都有用并且可以理解至关重要。然而,转录视频资产以及以确保跨不同屏幕和设备的可访问性所需的各种格式制作和整合准确字幕的过程可能是昂贵且缓慢的。当需要为大量内容生成字幕时,所涉及的时间和费用在规模上变得越来越令人望而却步。

可以在云中处理和分析视频的机器学习工具的出现为内容提供商提供了一个强大、可扩展的流程,用于自动化字幕创建过程。对于拥有数千小时的视频并且需要字幕以满足客户设定的无障碍要求的公司(例如在线培训提供商)而言,这是一项重要的省时省力的工作。

视频剪辑生成:从传统上看,视频剪辑的生成和发布过程需要一个手动工作流程,以从原始视频中识别相关内容,生成时间编码的剪辑,然后对这些剪辑进行转码、打包并分发到社交频道上。

这种高接触、多步骤的过程可能会导致延迟,并导致错过机会,特别是对于实况广播而言。现在,机器学习工具可以自动完成此过程的关键步骤,以帮助广播公司将高价值的剪辑近乎实时地在屏幕上播放给观众,这更适合社交媒体的即时性。

个性化和货币化:为了增加流媒体视频的收入机会,内容提供商必须配备基础设施,以提供针对个人用户的广告,并以适合每个查看者的方式投放,比如投放个性化广告。

通过机器学习增强型视频工作流程,内容提供商现在可以根据各种因素无缝地插入个性化广告,比如查看者使用的设备类型、查看者的人口统计信息,甚至是关于流式处理的内容的信息;这就是所谓的内容感知广告插入。

分析和度量:如今的视频工作流能够测量和报告看似无穷无尽的有关实时流和 VOD 流及其背后基础设施的信息。与各个组件、关键流程和完整工作流的性能相关的数据可供测量,并且可用于实时通知或长期分析。

为了识别新的见解和发现,机器学习系统的应用为内容提供商提供了新方法来优化视频工作流的各个方面,包括工作流性能、网络资源的使用、货币化结果等等。

未来可能的机器学习视频应用有哪些?

安全性:保护云的主要关注点之一是访问控制。例如,视频提供商希望防止员工犯错,以免意外地暴露隐私内容,比如未发布的大片的镜头。“机器学习安全保护”可以在其他人注意到之前检测出范围内受保护的内容,从而防止此类问题。

内容权利:对于视频提供商来说,另一个令人头痛的问题是,当有人在线发布受版权保护内容的视频时,会使用避免使用水印或内容过滤器的技巧;例如,将帧速率降低每秒一帧。设想一个机器学习解决方案,其中包含工作室脚本或版权所有者的内容;有了这些数据,解决方案可以扫描 Web 以获取新内容,并识别与脚本匹配的对话和音频。

视频演示:体育视频中的机器学习

基于框架的分析:学习如何轻松地识别和跟踪场景中的人,创建和公开场景中的元数据,并在此演示中利用 AWS Elemental Media Services 和 Amazon Rekognition 的极其快速和智能的搜索功能。

基于框架的分析的视频演示 [3:41]

开始使用

我们可以帮助您从咨询销售人员和架构设计组织入手,或者您也可以立即开始自己的试点部署。