Facebook-Social-Sharing-Button_Top
Twitter-Social-Sharing-Button_top
GooglePlus-Social-Sharing-Button_top
LinkedIn-Social-Sharing-Button_Top

MLB Advanced Media(MLBAM)는 데이터 수집 및 분석 도구를 사용하여 모든 경기를 캡처하고 분석하는 새로운 방식을 원했습니다. 즉, 북미 지역 야구 경기의 데이터를 빠르게 처리할 뿐만 아니라 실시간 분석에 충분한 컴퓨팅 파워를 갖추고 초 단위로 분석 결과를 생성할 수 있으며, 오프 시즌에는 중단할 수 있는 플랫폼이 필요했습니다.  그 결과, AWS를 선정하여 혁신적인 선수 추적 시스템(Player Tracking System)을 구현하게 되었습니다. 이 시스템은 경기의 미묘한 차이나 운동 능력에 대한 세부 정보, 즉 방송사를 비롯해 야구 팀과 팬들이 경기를 더욱 즐길 수 있는 정보를 새롭게 찾아내어 스포츠의 질을 높입니다.

mlbam-innovation-thumb

150년 역사를 거쳐 전설적인 선수들을 배출한 스포츠로서 야구 팬들에게는 정말 잊을 수 없는 경기였습니다. 2014년 월드 시리즈 마지막 7차전에서 San Francisco Giants와 Kansas City Royals는 3회까지 2대 2로 비기고 있었습니다. 이때 Royals의 Eric Hosmer가 중견수 방면으로 강한 타구를 날렸습니다. 이때 공이 내야를 벗어났더라면 경기를 뒤집을 수도 있었습니다.

하지만 Giants의 2루수인 Joe Panik이 몸을 날려 멋지게 공을 잡아 더블 플레이를 성공시켰습니다. 이때 Hosmer는 1루로 슬라이딩했지만 Panik의 송구가 더 빨랐습니다. 결국 Royals의 우승은 물거품이 되었고 Giants가 1점차로 승리하며 월드 시리즈 우승 팀이 되었습니다.

이날 Panik의 플레이는 소셜 미디어를 비롯해 술집이나 방송사 부스에서 화젯거리였습니다. 하지만 이날 플레이에 대한 세부 정보는 MLB Advanced Media(MLBAM)가 Amazon Web Services(AWS)를 사용해 새롭게 개발한 빅 데이터 솔루션인 클라우드 호스팅 시스템(선수 추적 시스템)에서 더욱 많이 찾아볼 수 있었습니다.

이 솔루션은 경기에서 발생하는 모든 플레이의 미묘한 복잡성을 수집 및 분석합니다. 이 경기에서도 분석 결과 Hosmer가 슬라이딩을 하지 않았더라면 1루에서 살 수도 있었습니다. 2015년 시즌 개막식에 맞춰 MLB 야구장 30곳 모두에 완벽하게 구축된 선수 추적 시스템은 "Statcast"라는 브랜드명으로 각 방송사에 전송되는 정보를 포함해 선수들의 멋진 플레이가 있을 때마다 수초 내에 데이터를 전송하여 새로운 열기를 더하고 있습니다.

MLBAM의 수석 부사장이자 최고 기술 책임자(CTO)인 Joe Inzerillo는 AWS가 없었더라면 Starcast도 없을 것이라고 말했습니다.

"소비자 행동은 변화하고 있습니다. 온라인이나 모바일 환경으로 소비자들이 이동하면서 이제 이러한 기술은 경기 발전에 중요한 역할을 하고 있습니다. 그 중에서도 가장 눈여겨볼 만한 것이 바로 AWS의 Statcase입니다. 지금까지는 측정할 수 없었던 항목을 이제 측정할 수 있게 되었습니다."

  • 사용된 AWS Services

  • AWS의 이점

    • AWS는 변동성이 크지만 미국 전역의 경기 일정에서 데이터 스트림을 처리할 수 있습니다.
    • 시즌별로 17페타바이트가 넘는 데이터를 처리, 분석 및 저장할 수 있습니다.
    • 경기가 없는 날과 시즌에는 MLBAM이 사용량을 줄일 수 있습니다.
    • 팬, 방송사 및 클럽 모두 선수와 선수의 플레이를 분석할 수 있는 새로운 방법을 제시합니다.
    • 데이터를 MLB 앱을 이용한 방송에 사용할 수 있습니다.



  • MLBAM 소개

    MLBAM은 Major League Baseball의 디지털 서비스 사업부입니다. 현재 MLB.com을 통해 공식 웹사이트와 Major League Baseball 클럽 웹사이트 30개를 운영하면서 새로운 소식이나 경기 결과, 통계 및 일정을 공개하고 있으며, 가입자에 한해 실시간 방송까지 제공합니다. 또한 MLB Radio와 BaseballChannel.TV까지 소유하여 운영 중이며, 그 밖에도 Minor League Baseball, YES Network, SportsNet New York, World Championship Sports Network 등 수많은 웹사이트를 운영 또는 소유하고 있습니다.


Panik과 Hosmer의 플레이 동영상에 나타난 Statcast 데이터

Panik과 Hosmer의 플레이 동영상에서 나타난 선수 추적 시스템(Statcast) 데이터. 오른쪽 빨간색 구간이 Hosmer가 1루까지 슬라이딩하지 않고 속도를 유지해 달렸다면 약 1피트 정도 앞서 살았을 거라는 것을 나타냅니다.

시즌을 지나면서 경기 내용을 분류한 통계 자료가 누적된다는 점에서 데이터는 야구 경기에서 중요한 역할을 합니다. 하지만 이러한 정보는 시간이 흐르면서 지난 정보로 묻혀 정적이 되고 맙니다. MLBAM은 데이터를 실시간으로 수집 및 분석하여 스포츠를 즐길 수 있는 미묘한 차이를 밝혀냄으로써 통계에 대한 접근법을 바꾸려고 했습니다.

MLBAM은 처음에는 온프레미스 IT 솔루션을 고려하였지만 결국 배제하였습니다. MLBAM에서 멀티미디어 기술 개발을 맡고 있는 부사장인 Dirk Van Dall은 "처음에는 모든 경기장에서 컴퓨팅 기능을 사용하려고 했습니다. 하지만 경기장이 너무 많아서 데이터를 효과적으로 분산시키려면 시간이 오래 걸릴 뿐만 아니라 광범위한 IT 리소스에 대한 투자가 필요하여 약 6개월을 두 손 놓고 기다려야 할 판이었습니다."라고 밝혔습니다.

이때 하루에 최대 15 경기를, 또는 며칠간 불과 1~2 경기도 지원할 수 있는 이상적인 대안으로 AWS 클라우드가 떠올랐습니다.

"AWS는 미국 전역을 대상으로 경기장과 클라우드 사이의 데이터 전송 시간을 줄일 수 있을 뿐만 아니라 Statcast를 구축하는 데 필요한 다양한 서비스를 제공합니다. AWS가 제공하는 뛰어난 확장성을 통해 가장 필요할 때 버스트하고, 하루에 하나, 둘 또는 많은 수의 경기를 관리하며, 오프 시즌에는 리소스 사용을 중단할 수 있습니다."라고 Van Dall은 덧붙였습니다.

경기장에서 좌표 정보를 제공하는 2개의 데이터 수집 시스템부터 워크플로가 시작됩니다. 홈 플레이트 뒤에는 Doppler 레이더 시스템이 설치되어 있어서 공의 위치를 초당 2,000회 샘플링합니다. 그 밖에도 일반적으로 3루 베이스 위에 설치되는 입체 영상 장치 2개가 필드의 선수 위치를 초당 30회 샘플링합니다. 이러한 시스템에서 수집되는 데이터는 선수의 움직임이 종료되면 필드 내 경기 요원이 각 플레이에 대한 간략한 설명을 입력하여 보강됩니다.

플레이가 끝난 후 10~15초가 지나면 데이터가 경기장의 프라이빗 네트워크를 통해 전송 및 집계되고 이후 AWS Direct Connect를 사용해 AWS 클라우드로 보내집니다. 여기에서 AWS Direct Connect는 빠른 데이터 전송을 위한 전용 네트워크를 말합니다. MLBAM은 이 솔루션에 컴퓨팅 파워를 지원하기 위해 Amazon Elastic Compute Cloud(Amazon EC2)를 사용합니다. 각 플레이의 좌표 데이터는 Amazon Simple Storage Service(Amazon S3)에 저장되며, 이후에는 확장을 통해 솔루션에서 생성되는 방대한 양의 정보까지 저장됩니다. MLBAM은 경기마다 평균 7TB의 데이터가 생성될 것으로 예측하고 있습니다. 시즌마다 전체 경기 수가 2,430회에 달하므로 한 시즌의 총 데이터는 약 17페타바이트에 이릅니다.

MLBAM은 Amazon ElastiCache를 사용하여 하드 드라이브가 아닌 메모리 캐시에 경기 정보를 임시로 저장하여 분석 작업 시 데이터를 빠르게 가져올 수 있습니다. 또한 Amazon DynamoDB가 쿼리를 실행하여 필요한 데이터에 대한 빠른 검색을 지원하는 동시에 Amazon CloudFront가 확장 가능한 솔루션을 구현하여 API의 역할을 합니다.

AWS Lambda는 이벤트에 대한 응답으로 코드를 실행하는 무서버 컴퓨팅 서비스로서 솔루션의 지표 엔진에서 데이터 피드 분석을 지원합니다. "Lambda는 정말 똑똑합니다. Lambda를 통해 원시 데이터를 수집한 후 정제 작업을 거쳐 오류를 검출합니다. 그런 다음 선수의 투구, 가속도, 최고 주루 속도 등 각 플레이에 대한 통찰력을 발굴할 수 있는 지표를 생성합니다. 이때부터 진정한 빅 데이터에 액세스하게 되지만 이건 시작에 불과합니다."라고 Van Dall이 말했습니다.

플레이가 끝나고 12초 내에 원시 지표와 동영상을 수신할 수 있는 방송사 키로서 데이터가 수신되면 1,000분의 1초 안에 분석이 이루어집니다.

MLBAM_arch-diagram
MLBAM_arch-diagram

AWS 기반 Statcast 아키텍처. 확대하려면 이미지를 클릭하십시오.

속도와 확장성을 비롯해 방대한 양의 데이터를 여러 가지 방법으로 수집, 분석 및 전송할 수 있는 능력은 누구나 경기를 즐기기 위한 MLBAM의 혁신적 노력에서 빠질 수 없는 요소입니다. 특히 예를 들어 가장 효율적인 주루를 보이는 선수나 필드 내 라인 드라이브에 가장 빠른 반응을 보이는 선수에 대한 논쟁에 믿을 만한 지표를 지닌 팬이라면 더욱 그렇습니다.

"우리는 야구 팬들에게 대화를 주도할 수 있는 실증적 정보를 제공하고 있습니다. 이는 스포츠에서 가장 중요한 부분이 아닐까 생각합니다."라고 Inzerillo가 말했습니다.

방송사 역시 방송 중 분석 방법을 이용하여 새로운 정보를 얻고 향후 최종 사용자의 참여를 강화하는 한편, 각 클럽은 새로운 데이터와 도구를 통해 선수를 분석하고 지도할 수 있습니다.

Van Dall은 다음과 같이 결론지었습니다. "우리는 AWS의 선수 추적 시스템이 모바일 앱이나 기기에 더욱 새롭고 흥미로운 정보를 전송한다고 확신하고 있습니다. 이러한 정보는 비디오 게임을 즐기거나, 시청 환경에 대한 기대치가 높은 젊은 세대의 야구 팬들에게 커다란 매력으로 자리 잡을 것입니다. 이제 완전히 새로운 수준의 야구 열기가 달아오르고 있습니다."

big-data-image

AWS를 이용한 빅 데이터 수집 및 분석 방법에 대해 자세히 알고 싶다면 빅 데이터 세부 정보 페이지를 참조하십시오.

mlbam-big-data-thumb

Joe Inzerillo가 MLBAM의 혁신을 이끌고 있는 AWS에 대해 소개합니다.

mblam-statcast-thumb

Joe Inzerillo가 MLBAM이 AWS를 통해 제품 출시를 앞당길 수 있는 방법에 대해 소개합니다.


Facebook-Social-Sharing-Button_v5
Twitter-Social-Sharing-Button_v4
GooglePlus-Social-Sharing-Button_v4
LinkedIn-Social-Sharing-Button_v4