Facebook-Social-Sharing-Button_Top
Twitter-Social-Sharing-Button_top
GooglePlus-Social-Sharing-Button_top
LinkedIn-Social-Sharing-Button_Top

MLB Advanced Media (MLBAM) 希望通过一种新的方式使用数据收集和分析工具来捕获和分析每场比赛。它的平台必须能够从北美各个棒球场快速提取数据,为实时分析提供充足的计算能力,数秒内生成结果,同时可以在 休赛期关闭。  它借助 AWS 支持其革命性的球员跟踪系统,该系统通过揭示全新的有关比赛的细微差异和运动员能力的详细信息––可以让球迷、广播员和球队更激动的信息,从而转变了比赛现状。

mlbam-innovation-thumb

对于棒球球迷来说,棒球是一项传奇性运动,拥有 150 年的历史。2014 年世界大赛的最后一场比赛中,第三局获胜者将赢得比赛,此时旧金山巨人队和堪萨斯城皇家队二比二平。皇家队的 Eric Hosmer 大力击球,使球飞向中外场。如果球离开内场,则此击打应该可以一举制胜。

然而巨人队二垒手 Joe Panik 一个精彩的飞扑守住了这个球,从而导致两人出局,包括 Hosmer,他在尝试飞扑击打 Panik 扔出的球后在一垒出局。皇家队一次可能的反击失败了,巨人队通过一垒安打赢得了世界大赛。

Panik 的比赛在社交媒体、酒吧及播音室里引发了许多讨论。但是,有关该比赛更详细的信息则位于云中托管的一个系统里,即全新的名为球员跟踪系统的大数据解决方案,该解决方案是 MLB Advanced Media (MLBAM) 使用 Amazon Web Services (AWS) 创建的。

该解决方案捕获和分析比赛中每个动作的细微复杂性,其显示 Hosmer 本可以通过跑到垒上安全地进入一垒,而不是飞扑。在 2015 赛季的开赛日,开始在所有的 30 个 MLB 棒球场全面部署球员跟踪系统,该系统正在引发新的观赛热情,在动作完成后的几秒内传输数据,包括以品牌名称“Statcast”发送到广播公司的信息。

MLBAM 执行副总裁兼首席技术官 Joe Inzerillo 表示,AWS 是让 Statcast 成为现实的关键。他说:

“消费者的行为正在发生改变,它即将上线,可以在移动设备上使用,这种技术对于比赛的发展至关重要。”“我们所从事的最令人兴奋的事情之一是由 AWS 为 Statcast 提供支持。有史以来,我们第一次测量了我们之前无法测量的东西。”

  • 使用的 AWS 服务

  • AWS 的优势

    • AWS 可以处理不断变动的全国赛程表的数据流
    • 按赛季提取、分析和存储 17+ PB 的数据
    • MLBAM 可以在休息日和 休赛期进行缩减
    • 为球迷、广播员和俱乐部提供分析比赛和球员的新方式
    • 数据可用于广播、MLB 应用



  • 关于 MLBAM

    MLBAM 是美国职棒大联盟旗下的数字服务公司。该公司通过 MLB.com 运营大联盟的官方网站,以及 30 个美国职棒大联盟俱乐部网站,为订阅者提供新闻、积分榜、统计信息和赛程表,以及实时音频和视频广播。MLBAM 也拥有和运营 MLB Radio 和 BaseballChannel.TV,经营或拥有大量的其他网站,如美国职棒小联盟、YES Network、SportsNet New York 和 World Championship Sports Network。


Statcast 数据叠加在 Panik-Hosmer 比赛的视频上

球员跟踪系统 (Statcast) 叠加在 Panik-Hosmer 比赛的 视频 上右侧的红色部分显示 Hosmer 如果保持他的速度,而不是飞扑接球,他本可以是安全的,只差大约一英尺的距离。

数据在棒球中扮演了重要角色,通过丰富的统计信息将各个赛季的比赛进行分类。但是,该信息属于历史信息,并且是静态的。MLBAM 想通过实时采集和分析数据以显示比赛的更多细节来改变其统计方法。

MLBAM 考虑采用本地 IT 解决方案, 但最终被否决了。“我们期望在所有体育场运用 计算 能力,”MLBAM 的多媒体技术开发副总裁 Dirk Van Dall 这样说到。“但是,从如此多的位置有效分发数据需要许多时间,同时需要投资昂贵的 IT 资源,而这些资源有大半年的时间是处于闲置状态的。”

AWS 云提供了理想的替代方案,可以为一天内进行的 15 场比赛提供支持,有些天只有一场或两场比赛。

Van Dall 表示,“AWS 可以覆盖全国,在比赛场地和云之间发送数据的往返时间也非常合理,同时提供我们用于构建“Statcast”的多个服务。“它提供了很好的扩展性,使我们在最需要它的时候有大量的资源,一天就可以完成一个、两个或更多的比赛,然后在休赛期关闭 资源。”

此工作流从体育场的两个数据采集系统开始,以提供协调信息。本垒板后面的多普勒雷达系统每秒对棒球位置进行 2,000 次取样。两个立体成像设备通常位于三垒线上方,每秒对球员在赛场上的位置进行 30 次取样。通过比赛结束后工作人员在现场输入的每场比赛的简要书面说明增加这些系统的数据。

比赛结束后的 10 到 15 秒,在体育场通过私有网络传输数据,进行汇总,然后使用 AWS Direct Connect 发送到 AWS 云,其提供专用的网络连接以进行快速的数据传输。MLBAM 使用 Amazon Elastic Compute Cloud (Amazon EC2),解决方案背后的计算能力。每场比赛的协调数据存储在 Amazon Simple Storage Service (Amazon S3) 中,其将扩展以容纳通过解决方案生成的海量信息。MLBAM 预计平均每场比赛将生成 7 TB 的数据。一个赛季有 2,430 场比赛,每个赛季大约有 17 PB 的数据。”

MLBAM 使用 Amazon ElastiCache 在内存缓存中临时存储比赛信息,而不是在硬盘上进行存储,从而可以更快的检索数据以执行分析任务。Amazon DynamoDB 为查询提供支持,同时支持所需的快速数据检索,而 Amazon CloudFront 则交付可扩展的解决方案以提供 API。

AWS Lambda 是一项无服务器计算服务,通过运行代码响应事件,支持在解决方案的指标引擎中对数据源进行分析。“Lambda 确实十分智能。Van Dall 表示,我们通过它提取原始数据,进行一些清理和错误检测,然后创建可以更好地洞察比赛的指标––扔球、球员的加速率、最高的跑步速度。”“我们正在访问真正的 大数据, 且还没有触及问题的表面。”

收到数据后,此分析只需几毫秒即可完成,这是广播员在比赛结束后 12 秒内收到原始指标和视频的关键。

MLBAM_arch-diagram
MLBAM_arch-diagram

AWS 提供支持的 Statcast 架构。单击图像可放大。

速度、可扩展性以及通过不同方式捕获、分析和提供大量数据的能力是 MLBAM 努力创新的核心,旨在让热爱比赛的每个人都受益,特别是那些现在具有可靠指标,可以就赛事进行讨论的球迷,例如,谁的跑垒效率最高或谁接平直球反应最快。

Inzerillo 表示“我们正在为球迷提供实实在在的信息,支持他们针对比赛进行讨论,这是比赛的重要部分”。

广播员也拥有新的信息用于直播分析,进一步增强观看者互动,而俱乐部则拥有新的数据和工具来分析和指导球员。

Van Dall 表示,“我们相信由 AWS 提供支持的球员跟踪系统可为应用和设备提供更令人激动的新信息,将吸引更年轻的球迷,此类球迷习惯于通过视频观看比赛,对观看体验有着诸多期待”。“它让棒球运动更加激动人心。”

big-data-image

如需了解有关 AWS 如何帮助您捕获和分析大数据,请访问我们的大数据详细信息页面

mlbam-big-data-thumb

Joe Inzerillo 介绍 AWS 如何支持 MLBAM 进行创新。

mblam-statcast-thumb

Joe Inzerillo 介绍 AWS 如何帮助 MLBAM 让产品快速上市。


Facebook-Social-Sharing-Button_v5
Twitter-Social-Sharing-Button_v4
GooglePlus-Social-Sharing-Button_v4
LinkedIn-Social-Sharing-Button_v4