Facebook-Social-Sharing-Button_Top
Twitter-Social-Sharing-Button_top
GooglePlus-Social-Sharing-Button_top
LinkedIn-Social-Sharing-Button_Top

Специалисты MLB Advanced Media (MLBAM) решили испытать новый метод записи и анализа каждой игры с помощью инструментов сбора и анализа данных. Для этого им требовалась платформа, способная осуществлять быстрый сбор данных с бейсбольных полей по всей Северной Америке и обладающая достаточной вычислительной мощностью, чтобы анализировать их в режиме реального времени и выдавать результат в считанные секунды. Работу этой системы планировалось приостанавливать на время между сезонами.  На базе ресурсов AWS им удалось создать революционную систему слежения за игроками (Player Tracking System), которая меняет представление об этом виде спорта, позволяя увидеть мельчайшие детали игры и движения игроков. Все это позволит болельщикам, комментаторам и участникам глубже погрузиться в атмосферу происходящего.

mlbam-innovation-thumb

Это была незабываемая игра для фанатов бейсбола – легендарного вида спорта со 150-летней историей. В третьем иннинге решающей седьмой игры Мировой серии 2014 года команды «Сан-Франциско Джайентс» и «Канзас-Сити Роялс» имели равный счет – каждая по два очка. Эрик Хосмер из команды «Роялс» сильно ударил по мячу, отправив его в центр поля. Этот удар мог подарить команде очко, если бы мяч покинул внутреннее поле.

Однако игрок второй базы «Джайентс» Джо Паник в умопомрачительном прыжке поймал мяч, что привело к двойному ауту – считая Хосмера, выдворенного с первой базы после прыжка в попытке опередить бросок Паника. Возможность заработать очко закончилась для «Роялс» провалом, «Джайентс» одержали победу в той игре и выиграли Мировую серию благодаря этой одной-единственной пробежке.

Игра Паника вызвала бурные обсуждения в социальных сетях, барах и кабинах комментаторов. Но детали этой игры выяснились благодаря системе слежения за игроками, основанной на облачных технологиях, – новейшем решении по работе с большими данными, которое создали специалисты MLB Advanced Media (MLBAM) на платформе Amazon Web Services (AWS).

С помощью этой системы, записывающей и анализирующей сложнейшие нюансы каждой игры, было показано, что Хосмер мог успеть добраться до первой базы, если бы продолжил бежать, вместо того чтобы совершать прыжок. На момент открытия сезона 2015 года система слежения за игроками полноценно работала на 30 полях Главной лиги бейсбола, вызывая у любителей спорта дополнительный интерес к игре благодаря данным, которые доставляются в течение нескольких секунд с момента действия. Сюда относится информация, которая передается вещательным компаниям под брендовым названием Statcast.

По словам исполнительного вице-президента и технического директора компании MLBAM Джо Инзерилло, ключом к созданию Statcast стали технологии AWS.

«Поведение клиентов меняется. Интернет и мобильные приложения играют все более важную роль, и без подобных технологий развитие игры стало бы невозможным, – рассказывает он. – Statcast на платформе AWS был для нас одним из самых интересных проектов. Впервые мы можем измерить показатели, которые до сих пор измерить было невозможно».

  • Использованные сервисы AWS

  • Преимущества сервисов AWS

    • Платформа AWS способна справиться с неравномерными потоками данных, которые обусловлены изменчивым расписанием игр по всей стране
    • Возможность сбора, анализа и хранения 17 и более петабайт данных за сезон
    • На усмотрение MLBAM можно уменьшать масштаб используемых ресурсов в дни без матчей и между сезонами
    • Новые возможности для болельщиков, комментаторов и бейсбольных клубов анализировать игры и тактику отдельных игроков
    • Возможность использования данных в телевизионном вещании и приложениях Главной лиги бейсбола



  • Сведения о MLBAM

    MLBAM – это подразделение Главной лиги бейсбола, которое предоставляет цифровые услуги. Компания поддерживает официальный веб-сайт Главной лиги бейсбола, а также 30 веб-сайтов входящих в ее состав бейсбольных клубов – на домене MLB.com, где доступны новости, турнирные таблицы, статистика и расписание игр, а также прямые аудио- и видеотрансляции для подписчиков. Также компания MLBAM является владельцем и оператором каналов MLB Radio и BaseballChannel.TV, а также поддерживает или обладает правами на многие другие веб-сайты, такие как Minor League Baseball, YES Network, SportsNet New York и World Championship Sports Network.


Данные системы Statcast, наложенные на видеозапись игры Паника и Хосмера

Данные из системы слежения за игроками (Statcast), наложенные на видеозапись игры Паника и Хосмера. Отмеченный красным отрезок справа показывает, что Хосмер мог бы опередить мяч сантиметров на тридцать, если бы продолжал бежать с той же скоростью, вместо того чтобы совершать прыжок в направлении базы.

Данные играют важнейшую роль в бейсболе, где требуется хранить большие объемы статистики и систематизировать архивы игр за многие сезоны. Тем не менее эта информация является исторической и статичной. В компании MLBAM решили изменить подход к статистике, записывая и анализируя данные в режиме реального времени, чтобы суметь передать более тонкие моменты этого вида спорта.

Сначала специалисты MLBAM рассматривали вариант локального ИТ-решения, но в итоге решили от него отказаться. «Мы хотели использовать вычислительные возможности на всех стадионах, – говорит Дирк Ван Далл, вице-президент MLBAM по развитию мультимедиа-технологий. – Но чтобы эффективно распределять данные из такого количества мест, потребовалось бы слишком много времени и средств на развертывание ИТ-ресурсов, которые оставались бы невостребованными в течение примерно полугода».

Оптимальной альтернативой оказалось облако AWS, которое может поддерживать до 15 игр в течение одного дня или всего одну-две игры, как это бывает в некоторые другие дни.

«Платформа AWS обеспечивает покрытие по всей территории страны, приемлемую скорость двусторонней передачи данных между игровыми полями и облаком, а также разнообразные сервисы, которые мы использовали для создания Statcast, – рассказывает Ван Далл. – Благодаря отличной масштабируемости мы можем наращивать производительность, когда она нам больше всего необходима – для одной, двух или нескольких игр в течение дня, – а затем отключать лишние ресурсы на период между сезонами».

Рабочий процесс начинается с двух систем сбора данных на стадионах, которые передают сведения о координатах. Позади основной базы установлена доплеровская радиолокационная система, регистрирующая положение мяча 2000 раз в секунду. Две стереоскопические передающие камеры, как правило, располагаются над линией третьей базы, фиксируя положение игроков на поле с частотой 30 кадров в секунду. Данные с этих систем дополняются короткими текстовыми описаниями, которые вводит персонал стадиона после окончания каждого эпизода игры.

Через 10–15 секунд после окончания эпизода данные передаются по частным сетям, установленным на стадионах, накапливаются и отправляются в облако AWS с использованием технологии AWS Direct Connect, которая предоставляет выделенное сетевое соединение для быстрой передачи данных. Для обеспечения вычислительной мощности системы компания MLBAM использует сервис Amazon Elastic Compute Cloud (Amazon EC2). Координатные данные положения игроков в каждом эпизоде помещаются в хранилище Amazon Simple Storage Service (Amazon S3), которое будет расширяться по мере накопления значительных объемов информации в системе. Согласно ожиданиям специалистов MLBAM, в среднем одна игра будет генерировать 7 ТБ данных. Если умножить это на 2430 игр в сезоне, получится около 17 ПБ данных за один сезон».

Вместо жестких дисков компания MLBAM использует сервис Amazon ElastiCache для временного хранения информации об игре в кэш-памяти, что позволяет быстро извлекать данные для анализа. Сервис Amazon DynamoDB позволяет создавать очереди и поддерживает быстрое извлечение данных по требованию, а сервис Amazon CloudFront представляет собой масштабируемое решение для доступа к интерфейсам API.

AWS Lambda, беcсерверный вычислительный сервис, который запускает пользовательский код при определенных событиях, поддерживает анализ потоков данных в подсистеме метрик. «Lambda – это по-настоящему интеллектуальный сервис. Мы берем исходные данные, слегка обрабатываем их и выявляем ошибки, после чего создаем метрики, которые позволяют глубже анализировать игры – броски, быстроту разгона игроков, наивысшую скорость пробежек, – рассказывает Ван Далл. – Мы имеем реальную возможность глубокого анализа больших данных, но пока только начали работать в этом направлении».

После получения данных их анализ занимает порядка нескольких миллисекунд, благодаря чему вещательные станции могут доставить исходные метрики и видео в течение 12 секунд после окончания эпизода игры.

MLBAM_arch-diagram
MLBAM_arch-diagram

Архитектура системы Statcast на базе платформы AWS. Нажмите на изображение для его увеличения.

Скорость, масштабируемость, а также разнообразные возможности записи, анализа и передачи большого количества данных – все это лежит в основе инновационного решения MLBAM, которое по достоинству оценят любители игры, особенно болельщики. Теперь у них есть надежные метрики, чтобы аргументировать, например, чьи пробежки к базам наиболее эффективны или у кого быстрее реакция на горизонтально летящий мяч.

«Мы даем болельщикам фактическую почву для таких дискуссий, которые составляют основу спорта как такового», – утверждает Инзерилло.

Также и у спортивных комментаторов теперь есть свежая информация, которую можно анализировать в прямом эфире, повышая вовлеченность зрителей, а бейсбольные клубы получили инструменты, позволяющие изучать последние данные и использовать их для тренировки игроков.

«Мы уверены, что система слежения за игроками на базе платформы AWS сможет передавать новую интересную информацию, используя приложения и мобильные устройства, что должно понравиться молодому поколению болельщиков, которые привыкли к видеоиграм и очень требовательны к визуальным впечатлениям, – говорит Ван Далл. – Наша система выводит интерес к бейсболу на новый уровень».

big-data-image

Чтобы подробнее узнать о том, как платформа AWS помогает записывать и анализировать большие данные, посетите страницу с описанием работы с большими данными.

mlbam-big-data-thumb

Джо Инзерилло объясняет, какую роль играет платформа AWS в передовых разработках компании MLBAM.

mblam-statcast-thumb

Джо Инзерилло рассказывает о том, как платформа AWS помогает быстро выводить на рынок продукты MLBAM.


Facebook-Social-Sharing-Button_v5
Twitter-Social-Sharing-Button_v4
GooglePlus-Social-Sharing-Button_v4
LinkedIn-Social-Sharing-Button_v4