適用於媒體應用程式的機器學習
機器學習、人工智慧及深度學習之間的差異
機器學習是指使用學習演算法建立一個模型,用以了解現有資料之間的關係,進而對新資料做出預測。機器學習一詞經常與人工智慧交替使用,但這些用詞其實指的是相關卻獨立的概念。
人工智慧是指,在沒有明確程式設計的情況下,能針對真實情況做出感應、學習、理解、行動及適應 – 從廣義而言,人工智慧可以定義為能在某種程度上展現類似人類之智慧的任何系統。
因此,如果人工智慧大致的概念是,建構讓電腦可在沒有使用者的明確指示下,學習並做出決定的解決方案,那麼機器學習就是開發人員打造這些能力所用的方法。
深度學習是討論機器學習時第三個經常會使用的用語。深度學習不使用明確的數學演算法,而是會嘗試使用稱為類神經網路的系統,按照人類大腦的運作和學習方式建立模型。
重點整理:有多種方式可以建構一個能展現類似人類特質的系統,這個系統具有以規則為基礎的系統,以及以知識為基礎的系統,在過去幾十年中,這些系統已經存在。但機器學習已深植於統計資料中,因此您會使用機器學習工具和服務來建構人工智慧應用程式和系統。
人工智慧
在沒有明確程式設計的情況下,能針對真實情況做出感應、學習、理解、行動及適應。
機器學習
使用學習演算法,從資料中建立模型 (在監督、無監督或強化模式下) 的運算方法。
深度學習
由類神經網路衍生而來的演算法,透過層層神經元學習,連續學習複雜的表示法。
雲端機器學習有何不同?
結合大量的運算能力、資料湖、安全性、分析功能及雲端服務整合能力後,讓機器學習從實驗性的利基技術蛻變成重要的商業建構區塊。
而今,有越來越多的公司使用機器學習來準備要分析的資料、建構和微調機器學習模型,以及利用最終使用者認知應用程式 (包括語音辨識、圖片和影片分析) 來提供預測和建議,以及其他許多的智慧解決方案。
如此,機器學習可以從驅動每日業務的系統、程序和資訊技術中,發掘出新的洞見、發現及效率。幾乎所有業務或創意工作之下的核心基礎設施,都可以利用機器學習技術予以強化,藉此為工作成果,以及與其互動的人員和程序增加價值。
對於媒體娛樂業的影片供應商、企業和公共事業、以及機器學習可增加影片內容價值並創造優異觀眾體驗的所有領域來說,越來越是如此。
尤其是影片供應商,適用於影片雲端機器學習工具的應用程式,不但數量龐大,而且仍持續開發並且不斷進行完善。
雲端機器學習對影片有哪些優點?
當今的影片供應商有幾個共同的問題:
- 場景中有哪些演員?
- 何時會表達特定對白?
- 螢幕上的物件有哪些?
- 一旦我們知道存在所謂的演員/場景/對白/物件,當我們需要這些內容時,要如何準確擷取出來呢?
雲端影片機器學習提供解決所有問題的便利方式。以下是這項技術的幾種解決方式。
可搜尋的影片存檔:使用雲端機器學習服務,影片團隊可以大幅減少從影片存檔中花在編目、搜尋和建構資產的時間和資源。採用機器學習技術的內容索引編制和中繼資料產生,可以讓許多應用程式具備顯著的真實優點。
舉例來說,許多廣播公司必須維持龐大的影片內容存檔,這些內容通常來自不同來源,並且使用不一致的系統 (如有) 來標記資產。有了機器學習工具,就不再需要使用耗時的人工方式,來標記用於搜尋的內容,並且可以優化影片內容庫,以達到快速準確的搜尋。
自動化影片字幕:字幕中繼資料是讓所有觀眾可以有效使用及接觸影片的重要元素。不過,針對各種格式,轉錄影片資產以及製作和整合準確字幕,以確保不同螢幕和裝置都可以存取的過程,不僅成本高昂,且速度很慢。當您必須產生大量內容的字幕時,相關所需時間和支出也會變得非常高。
隨著可在雲端中處理和分析影片的機器學習工具出現,為內容供應商帶來強大、可擴展的自動化字幕建立流程。這對公司來說,是節省寶貴時間和人力的重要方式,譬如線上培訓供應商,他們有數千小時的影片,並且需要字幕,以滿足客戶所設定的輔助功能要求。
影片剪輯的產生:過去,產生和發佈影片剪輯的過程,都需要手動工作流程,從原始影片中找出相關內容,接著產生有時間編碼的剪輯,然後轉碼、封裝再散佈這些剪輯,以發佈到社群頻道上。
這個高接觸、多步驟的流程可能會造成延遲,並導致錯失機會,即時事件廣播更是如此。現在,機器學習工具可以自動化程序的步驟,協助廣播公司以接近即時的方式,將高價值的剪輯呈現在觀看者的螢幕上 – 這更符合社群媒體所具備的即時性優勢。
個人化與獲利:為了優化串流影片的營收機會,內容供應商的基礎設施必須能將廣告提供給鎖定的個別使用者,並根據每位觀看者,以量身訂做的方式提供,例如,透過個人化廣告。
運用機器學習增強的影片工作流程,內容供應商現在可以根據各種因素,無縫插入個人化的廣告,例如,觀看者使用的裝置類型、觀看者的背景資訊,或串流的內容相關資訊等;這就是所謂的內容感知廣告插入。
分析和測量:如今的影片工作流程能夠測量和回報即時和 VOD 串流及其背後的基礎設施的無限資訊量。與個別元件、關鍵程序和整個工作流程相關的資料,都可以進行測量,並用於即時通知或長期分析。
為了要找出新的洞見和發現,機器學習系統的應用可以提供優化影片工作流程各個層面的新方法,包括工作流程效能、網路資源的使用、獲利結果及其他等。
未來可能的機器學習影片應用有哪些?
安全性:保護雲端安全的一個主要考量重點,就是存取控制。舉例來說,影片供應商希望防止員工發生可能意外暴露不公開內容的錯誤,例如,洩漏尚未發行強片中的畫面。「機器學習安全防衛」可以在任何其他人發現之前,偵測出實際的受保護內容,進而避免發生這樣的問題。
內容版權:另一個讓影片供應商頭痛的問題是,某人在線上發佈受版權保護的內容影片,但其中設有阻止浮水印或內容篩選的機制;例如,以每秒一個畫面放慢畫面播放速率。設想機器學習解決方案會載入工作室腳本或版權持有人內容;有了這樣的資料,解決方案就可以掃描 Web 尋找新內容,然後辨識符合腳本的對話和音訊。
影片示範:運動影片中的機器學習
以畫面為基礎的分析:在此示範中,了解您可以如何輕鬆地識別和追蹤場景中的人物、從該場景中建立和公開中繼資料,以及利用非常快速且智慧的搜尋功能,來配對 AWS Elemental 媒體服務與 Amazon Rekognition。