人工智慧 (AI) 是電腦科學的一個領域,致力於解決與人類智慧相關的常見認知問題,例如學習、解決問題和模式辨識。人工智慧 (通常簡稱為 "AI") 呈現出機器人或未來世界的景像,也就是說,AI 不再是科幻小說中虛構的機器人,而真正成為現代高階電腦科學中的現實。Pedro Domingos 教授是這個領域聲譽卓著的研究人員,提出機器學習的「五大流派」,包括:符號主義 (Symbolists),源自於邏輯和哲學;聯結主義 (Connectionists),神經科學的分支;進化主義 (Evolutionaries),與進化生物學相關;貝葉斯派 (Bayesians),採用統計學和概率方法;以及類比主義 (Analogizers),源自於心理學。最近由於統計運算效率的提高,所以貝葉斯派的學者成功地讓「機器學習」在很多領域更向前邁進。同樣地,網路運算方面的進展也讓聯結主義流派的學者進一步發展「深度學習」這個分支。機器學習 (ML) 和深度學習 (DL) 這兩個電腦科學領域都是從人工智慧這個學科衍生出來的。
這些技術大體上分為「監督」和「未監督」兩種學習技巧,「監督」使用包含預期結果的訓練資料,「未監督」則使用不包含預期結果的訓練資料。
提供 AI 越多資料,它就會變得「越聰明」而且學習更快,企業每天產生這些資料讓機器學習和深度學習解決方案更加完備,包括從資料倉儲 (如 Amazon Redshift) 收集或擷取的資料、透過 Mechanical Turk 的「群眾」力量所產生的真實資料,或是透過 Kinesis Streams 動態探勘得到的資料等等。此外,由於 IoT 的出現,感應器技術讓需要分析的資料量大幅暴增,這些資料包含之前幾乎不曾接觸過的來源、地點、物件及事件資料。
機器學習是多種貝葉斯派技巧的通稱,用於模式辨識和學習。機器學習的核心是演算法的集合,可根據記錄的資料學習和進行預測、優化不確定情況下的特定公用程式函數、從資料擷取隱藏的結構,以及將資料分類成精確的描述。如果明確的程式設計太過於死板或不實際,通常會使用機器學習。相較於軟體開發人員為了根據特定輸入來產生程式碼特定輸出所開發的一般電腦程式碼相比,機器學習使用資料產生統計程式碼 (ML 模型),它會根據從之前輸入範例 (在監督學習技巧中也包括輸出範例) 辨識的模式輸出「正確的結果」。ML 模型的正確性主要取決於過去資料的質和量。
有了正確的資料,ML 模型可以利用數十億個範例來分析高維度問題,以找出可根據特定輸入預測結果的優化函數。ML 模型通常可根據統計方法提出可靠的預測及整體效能。如果您要使用 ML 模型或任何個別預測,這類評估分數對於決策而言很重要。
Amazon.com 將許多業務建立在以機器學習為基礎的系統上。如果沒有 ML,Amazon.com 就無法擴展業務、提升客戶體驗和選擇,以及優化物流速度和品質。Amazon.com 創立 AWS 是為了讓其他企業也能享有相同的 IT 基礎架構,並充分利用其敏捷性和成本效益,我們現在仍持續致力於讓 ML 技術普及到各個企業。
Amazon.com 開發團隊的結構及對運用 ML 來解決困難的實際商業問題的專注,促使 Amazon.com 與 AWS 開發易於使用且功能強大的 ML 工具及服務。這些工具就像其他 IT 服務一樣,會先在 Amazon.com 內部和關鍵任務環境中進行測試,然後才以 AWS 服務的形式公開供各個企業使用。
機器學習通常用來根據過往的資料來預測未來的結果。例如,組織會使用機器學習根據特定人口統計學來預測他們的產品在未來會計年度的銷售量;或是預測具備哪些特性的客戶對品牌不滿意或最忠實的可能性最高。這類預測有助於做出更好的商業決策、提供更貼近個人的使用者體驗,以及具備降低消費者忠誠度成本的潛力。ML 可補足商業智慧 (BI) (主要在於報告過去的商業資料) 不足的地方,可根據以往的趨勢和交易來預測未來的結果。
在企業中成功實作 ML 有幾個步驟。首先,找出真正的問題;識別明確後可讓企業受益的預測。接著,必須根據以往的業務指標 (交易、銷售、損耗等等) 收集資料。資料彙總之後,即可依據這些資料建立 ML 模型。執行 ML 模型並將模型的預測輸出套用回商業系統,以做出更明智的決策。

在您的組織中實作機器學習
深度學習是機器學習的分支,它涉及分層演算法,目的是更深入地了解資料。 演算法不再侷限於建立一組可解釋的關係做為更基本的迴歸。 反之,深度學習倚賴非線性演算法的這些分層,以建立依據一系列因子互動的分散式表示法。 為深度學習演算法提供大量的訓練資料之後,就能開始識別這些元素之間的關係。 這些可能是圖形、色彩、字詞等之間的關係。 之後,就能使用系統來建立預測。 在機器學習和人工智慧中,系統的深度學習主體能夠比人類實際在軟體編寫的程式碼識別更多關係,或者甚至識別人類無法察覺的關係。 經過足夠的訓練之後,就能讓演算法網路開始對非常複雜的資料進行預測或解譯。
卷積神經網路在許多視覺任務 (包括物體分類) 上的表現超越人類。 提供數百萬個加上標籤的圖片之後,演算法系統能夠開始識別影像的主體。 許多相片儲存服務 (包括臉部辨識) 透過深度學習執行。 這對 Amazon Rekognition、Amazon Prime Photos 和 Amazon Firefly Service 非常重要。
Amazon Alexa 及其他虛擬輔助工具旨在辨識請求和傳回回應。 雖然人類在非常年幼的時候就能理解別人說的話,但是直到最近電腦才能夠聆聽和回應人類。 人類有各式各樣的口音和說話模式,因此使用較為傳統的數學或電腦科學完成這項機器任務非常困難。 使用深度學習,演算法系統能夠更輕鬆地判別說出的內容及意圖。
自然語言處理希望教導系統理解人類語言、語調和內容。 這開始允許演算法分辨更困難的概念,像是情緒或諷刺。 由於很多公司想要透過語音或文字機器人 (與 Amazon Lex 使用的一樣) 自動化客戶服務,因此這個領域正在不斷成長。