依照實作指南開始使用

6 個步驟  |  30 分鐘

Machine_Learning_HERO-ART_SM

問:什麼是 Amazon Machine Learning (Amazon ML)?

Amazon ML 是一種服務,可讓您輕鬆建立預測應用程式,包括詐騙偵測、需求預報和點擊預測。Amazon ML 使用強大的演算法,透過找出現有資料的模式協助建立機器學習模型,然後使用這些模式對新出現的資料進行預測。AWS 管理主控台和 API 提供資料和模型視覺化工具,同時提供精靈,引導您完成建立機器學習模型、測量模型品質以及微調預測結果的程序,以符合應用程式要求。模型建立之後,您可以使用簡單的 API 以取得應用程式的預測結果,無須實作自訂的預測產生碼或管理任何基礎設施。Amazon ML 具有很高的可擴展性,可以產生數十億則預測結果,並以極高的輸送量即時運用這些結果。使用 Amazon ML 無須設定費用,只需按使用量付費,因此可先從小規模開始,再視應用程式的發展情況進行擴展。

問:Amazon ML 有哪些使用案例?

Amazon ML 可用來建立各種預測應用程式。例如,您可以使用 Amazon ML 來協助建立應用程式,使其具有各種功能,包括可疑交易標記、詐騙訂單偵測、需求預報、內容個人化、使用者活動預測、評論過濾、社交媒體監聽、任意文字分析以及項目推薦等。

問:Amazon ML 有哪些安全措施?

Amazon ML 確保機器學習模型和其他系統成品在傳輸和靜止狀態下全部經過加密。對 Amazon ML API 和主控台發出的請求,都在安全 (SSL) 連線中進行。您可以使用 AWS Identity and Access Management (AWS IAM) 控制可存取特定 Amazon Machine Learning 動作和資源的 IAM 使用者。

問:使用 Amazon ML 時,我可將資料存放在哪裡?

您可以使用 Amazon ML 讀取三個資料存放區中的資料:(a) Amazon S3 中的一或多個檔案,如同此專案範例;(b) Amazon Redshift 查詢的結果;或是 (c) 在執行 MySQL 引擎的資料庫中執行 Amazon Relational Database Service (RDS) 查詢的結果。其他產品中的資料通常可以在 Amazon S3 中匯出為 CSV 檔,供 Amazon ML 使用。有關設定許可讓 Amazon ML 存取支援的資料存放區的詳細說明,請參閱 Amazon Machine Learning Developer Guide

問:我想在此專案範例中使用自己的資料。對於可用於訓練的資料集是否有大小限制?

Amazon ML 用來訓練模型的資料集最大不可超過 100 GB。

問:如果模型提供的結果不符合我的要求,該怎麼進行調整?

提高模型品質最好的方法是在訓練中增加資料量並提高資料品質。增加更多觀察結果、新增其他資訊類型以及轉換資料以優化學習過程,這些都是改善模型預測準確度最好的方法。Amazon ML 還提供多種參數用於調校學習過程:(a) 模型目標大小、(b) 對資料執行操作的次數,以及 (c) 應用於模型的規則化類型和數量。最後,對於模型調校最重要的一點是,需考量應用程式如何解釋機器學習模型產生的預測結果,以及如何以最佳的方式使其與企業目標保持一致。Amazon ML 可協助您調整二進位分類模型的解釋分界點,讓您在面對經過訓練的模型可能犯的各種錯誤時,找到最合適的平衡點。例如,一些應用程式對誤報的容錯度比較高,但是非常不希望有漏報的錯誤,Amazon ML 服務主控台可協助您調整分界點以符合此類要求。

問:使用 Amazon ML 建立的預測模型可以用來做什麼?

產生預測之後,有數種方式可以利用這些結果。例如,您可以將資料載入試算表,依預測分數來排序和篩選資料。資料也可以載入 Amazon RDS 或 Amazon RedShift 這類的資料庫,產生合格片段的清單。此外,您還可以使用 Amazon DynamoDB 將預測分數載入 NoSQL 資料庫,將預測分數即時提供給應用程式使用。

依照實作指南開始使用