什麼是 AI 中的深度學習?
深度學習是人工智慧 (AI) 方法,教導電腦如何以形似人類大腦的方式處理資料。深度學習模型可識別圖片、文字、聲音和其他資料的複雜模式,藉此產生更準確的洞察和預測。您可以使用深度學習方法將通常需要人類智慧的任務自動化,例如描述影像或將聲音檔案轉錄為文字。
為什麼深度學習很重要?
深度學習技術驅動了許多日常產品中使用的人工智慧應用程式,例如:
- 聊天機器人和程式碼產生器
- 數位助理
- 聲控電視遙控器
- 詐騙偵測
- 自動臉部辨識
它也是技術的關鍵組成部分,例如自動駕駛、虛擬實境等。企業使用深度學習模型來分析資料並在各種應用程式中進行預測。
什麼是深度學習使用案例?
深度學習在汽車、航太、製造、電子、醫學研究和其他領域中具有若干使用案例。
- 自動駕駛汽車使用深度學習模型進行物體偵測。
- 國防系統使用深度學習來標示衛星影像中感興趣的區域。
- 醫學影像分析使用深度學習來偵測癌細胞,以進行醫學診斷。
- 工廠使用深度學習應用程式來偵測人員或物件是否位於機器的不安全距離內。
這些深度學習的各種使用案例可分成五大類:電腦視覺、語音辨識、自然語言處理 (NLP)、建議引擎和生成式 AI。
電腦視覺
電腦視覺可自動從圖片和影片中擷取資訊及洞察。深度學習技術以與人類相同的方式理解圖像。電腦視覺有多種應用,例如:
- 內容審核,可自動從影像和影片封存中移除不安全或不當的內容
- 面部識別,可識別面部,並識別睜眼、眼鏡和面部毛髮等屬性
- 影像分類,可識別品牌標誌、服裝、安全裝備和其他影像詳細資訊
語音識別
儘管語音模式、音調、語氣、語言和口音不同,深度學習模型仍然可以分析人類語音。虛擬助理,例如 Amazon Alexa、文字轉換語音和語音轉換文字軟體可使用語音辨識執行下列任務:
- 協助呼叫中心客服人員並自動對呼叫分類。
- 將臨床對話即時轉化為文件。
- 為影片和會議錄音提供準確的字幕,以擴大內容覆蓋範圍。
- 將指令碼轉換為智慧語音協助的提示。
自然語言處理
電腦使用深度學習演算法,從文字資料和文件中收集洞察和意義。這種處理自然、人工建立文字的功能具有若干使用案例,包括:
- 自動化虛擬客服和聊天機器人
- 文件或新聞文章的自動匯總
- 對電子郵件和表單等長篇文件進行商業智慧分析
- 指示情緒關鍵短語的索引,例如社交媒體上的正面和負面評論
推薦引擎
應用程式可以使用深度學習方法來追蹤使用者活動並開發個人化建議。可以分析使用者的行為,並幫助他們發現新的產品或服務。例如,
- 推薦個人化影片和內容。
- 推薦自訂的產品和服務。
- 篩選搜尋結果,以根據使用者位置和行為,凸顯相關內容
生成式 AI
生成式 AI 應用程式可以建立新內容,並更精準地與終端使用者溝通。他們可以協助自動化複雜的工作流程、腦力激盪產生想法,以及進行智慧知識搜尋。例如,透過 Amazon Q Business 和 Amazon Q Developer 等生成式 AI 工具,使用者可以
- 提出自然語言問題,並從多個內部知識來源獲得經過摘要的回答。
- 取得程式碼建議,以及自動掃描程式碼和升級。
- 更快地建立新文件、電子郵件和其他行銷內容。
深度學習如何運作?
深度學習模型是按照人類大腦設計的神經網路。人腦包含數百萬個互連的生物神經元,這些神經元會協同合作以學習和處理資訊。同樣地,人工神經元是稱為節點的軟體模組,其會使用數學計算來處理資料。深度學習神經網路 (或人工神經網路),包含了許多人工神經元層,一同解決複雜的問題。
深度神經網路包含以下組成部分。
輸入層
人工神經網路有幾個節點,可以將資料輸入到其中。這些節點構成了系統的輸入層。
隱藏層
輸入層會處理資料,並將資料傳遞到神經網路的其他層中。這些隱藏層會在不同層級處理資訊,在接收新資訊時調整它們的行為。深度學習網路有數百個隱藏圖層,可用來從幾個不同的角度分析問題。
例如,如果您獲得了一張您必須對其進行分類的未知動物的影像,則可以將其與您已經認識的動物進行比較。例如,您可以觀察它的眼睛和耳朵的形狀、大小、腿的數量以及其毛皮圖案。您可以嘗試識別模式,如下所示:
- 動物有蹄,所以它可能是牛或鹿。
- 動物有貓的眼睛,所以它可能是某種野貓。
深度神經網路中的隱藏層會以相同的方式運作。如果深度學習演算法嘗試對動物影像進行分類,則其每個隱藏層都會處理動物的不同特徵,並嘗試對其進行準確的分類。
輸出層
輸出層由輸出資料的節點組成。輸出「yes」或「否」答案的深度學習模型在輸出層中只有兩個節點。另一方面,那些輸出範圍更廣的答案具有更多節點。生成式 AI 具有複雜的輸出層,可以產生與其訓練資料集中的模式相符的新資料。
深度學習網路有哪些元件?
深度神經網路包含以下組成部分。
輸入層
人工神經網路有幾個節點,可以將資料輸入到其中。這些節點構成了系統的輸入層。
隱藏層
輸入層會處理資料,並將資料傳遞到神經網路的其他層中。這些隱藏層會在不同層級處理資訊,在接收新資訊時調整它們的行為。深度學習網路有數百個隱藏圖層,可用來從幾個不同的角度分析問題。
例如,如果您獲得了一張您必須對其進行分類的未知動物的影像,則可以將其與您已經認識的動物進行比較。例如,您可以觀察它的眼睛和耳朵的形狀、大小、腿的數量以及其毛皮圖案。您可以嘗試識別模式,如下所示:
- 動物有蹄,所以它可能是牛或鹿。
- 動物有貓的眼睛,所以它可能是某種野貓。
深度神經網路中的隱藏層會以相同的方式運作。如果深度學習演算法正在嘗試對動物影像進行分類,則其每個隱藏層都會處理動物的不同特徵,並嘗試對其進行準確的分類。
輸出層
輸出層由輸出資料的節點組成。輸出「yes」或「否」答案的深度學習模型在輸出層中只有兩個節點。另一方面,那些輸出範圍更廣的答案具有更多節點。
機器學習、深度學習與生成式 AI 之間有何差異?
機器學習、深度學習和生成式 AI 的術語表示神經網絡技術有所進展。
機器學習
深度學習是機器學習的子集。深度學習演算法的出現是為了提高傳統的機器學習技術的效率。傳統的機器學習方法需要大量的人力來訓練軟體。例如,在動物影像識別中,您需要執行以下動作:
- 手動標記成千上萬的動物影像。
- 讓機器學習演算法處理這些影像。
- 在一組未知的影像上測試這些算法。
- 確定某些結果不準確的原因。
- 透過標記新影像來改善資料集,進而提高結果的準確性。
這個過程稱為監督學習。在監督式學習中,只有當您擁有廣泛且多樣化的資料集時,結果準確性才會提高。例如,演算法可能會準確識別黑貓,而不是白貓,因為訓練資料集中的黑貓影像更多。在這種情況下,您將需要更多已加上標籤的白貓圖片資料,來再次訓練機器學習模型。
相較於機器學習,深度學習有哪些優點?
相較於傳統機器學習,深度學習網路具有以下優點。
有效處理非結構化資料
機器學習方法發現非結構化資料 (例如文字文件) 難以處理,因為訓練資料集可能有無限變化。另一方面,深度學習模型可以理解非結構化資料並進行一般性觀察,而無需手動擷取特徵。例如,神經網路可以識別這兩個不同的輸入句子具有相同的含義:
- 您能告訴我如何付款嗎?
- 如何轉帳?
隱藏的關係和模式探索
深度學習應用程式可以更深入地分析大量資料,並揭示可能尚未接受過訓練的新洞察。例如,假設深度學習模型經過訓練,則可分析消費者購買。該模型僅包含您已購買的項目的資料。但是,人工神經網路可將您的購買模式與其他類似客戶的購買模式進行比較,進而就您尚未購買的新商品提供建議。
無監督學習
深度學習模型可以根據使用者行為,隨時間的推移學習和改進。它們不需要標記資料集的大量變化。例如,考慮透過分析您的打字行為,來自動糾正或建議單詞的神經網路。我們假設其用英文訓練,並且可以對英語單詞進行拼寫檢查。但是,如果您經常輸入非英語單詞,例如 danke,神經網路也可以自動學習和糾正這些單詞。
動態資料處理
動態資料集有大量的變化。其中一個範例是銀行的貸款還款金額。深度學習類神經網路可以對資料進行分類和排序,方法是分析金融交易,並將其中一些標記為詐騙偵測。
生成式 AI
生成式 AI 將機器學習和深度學習的神經網路提升到新的層次。機器學習和深度學習專注於預測和模式識別,生成式 AI 根據其偵測的模型產生獨特的輸出。生成式 AI 技術奠基於變壓器架構,結合多種不同的神經網路,以獨特的方式結合資料模式。深度學習網路首先將文字、圖片和其他資料轉換為數學抽象概念,然後重新轉換為有意義的新模式。
什麼是機器學習背景下的深度學習?
深度學習是一種機器學習。深度學習演算法的出現是為了提高傳統的機器學習技術的效率。傳統的機器學習方法需要大量的人力來訓練軟體。例如,在動物影像識別中,您需要執行以下動作:
- 手動標記成千上萬的動物影像。
- 讓機器學習演算法處理這些影像。
- 在一組未知的影像上測試這些算法。
- 確定某些結果不準確的原因。
- 透過標記新影像來改善資料集,進而提高結果的準確性。
這個過程稱為監督學習。在監督學習中,只有當您擁有廣泛且多樣化的資料集時,結果準確性才會提高。例如,演算法可能會準確識別黑貓,而不是白貓,因為訓練資料集中的黑貓影像更多。在這種情況下,您將需要標記更多的白貓影像,然後再次訓練機器學習模型。
相較於機器學習,深度學習有哪些優點?
相較於傳統機器學習,深度學習網路具有以下優點。
有效處理非結構化資料
機器學習方法發現非結構化資料 (例如文字文件) 難以處理,因為訓練資料集可能有無限變化。另一方面,深度學習模型可以理解非結構化資料並進行一般性觀察,而無需手動擷取特徵。例如,神經網路可以識別這兩個不同的輸入句子具有相同的含義:
- 您能告訴我如何付款嗎?
- 如何轉帳?
隱藏的關係和模式探索
深度學習應用程式可以更深入地分析大量資料,並揭示可能尚未接受過訓練的新洞察。例如,假設深度學習模型經過訓練,則可分析消費者購買。該模型僅包含您已購買的項目的資料。但是,人工神經網路可將您的購買模式與其他類似客戶的購買模式進行比較,進而就您尚未購買的新商品提供建議。
無監督學習
深度學習模型可以根據使用者行為,隨時間的推移學習和改進。它們不需要標記資料集的大量變化。例如,考慮透過分析您的打字行為,來自動糾正或建議單詞的神經網路。我們假設其用英文訓練,並且可以對英語單詞進行拼寫檢查。但是,如果您經常輸入非英語單詞,例如 danke,神經網路也可以自動學習和糾正這些單詞。
動態資料處理
動態資料集有大量的變化。其中一個範例是銀行的貸款還款金額。深度學習類神經網路也可以對資料進行分類和排序,例如分析金融交易,並將其中一些標記為詐騙偵測。
深度學習有哪些挑戰?
下方列出了實作深度學習和生成式 AI 的挑戰。
大量高品質資料
當您使用大量高品質資料進行訓練時,深度學習演算法可提供更好的結果。輸入資料集中的異常值或錯誤可能會對深度學習程序產生重大影響。例如,在我們的動物影像範例中,如果資料集意外引入了非動物影像,深度學習模型可能會將飛機歸類為海龜。
若要避免此類錯誤,您必須先清理並處理大量資料,再訓練深度學習模型。輸入資料預處理需要大量的資料儲存容量。
大量處理能力
深度學習演算法屬於運算密集型演算法,需要具備足夠運算容量的基礎設施才能正常運作。否則,它們需要很長時間來處理結果。
生成式 AI 和雲端深度學習有什麼好處?
在雲端基礎設施上執行生成式 AI 和深度學習可協助您更快地設計、開發和訓練應用程式。
速度
您可以使用 GPU 和 CPU 叢集更快地訓練生成式 AI 和深度學習模型,以便執行神經網路所需的複雜數學運算。然後,您可以部署這些模型來處理大量的資料,並產生越來越密切相關的結果。
可擴展性
雲端上有各式各樣的隨需資源,您可以存取近乎無限的硬體資源來處理任何規模的 AI 深度學習模式。您的神經網路可利用多個處理器,以在不同的處理器類型和數量下無縫、有效地分配工作負載。
工具
您可以存取 AI 和深度學習工具,例如筆記本、偵錯工具、分析工具、管道、AIOps 等等。您可以在雲端中以服務形式處理現有的生成式 AI 模型,而無需透過基礎設施來託管模型。即使知識和訓練有限,團隊也可以從生成式 AI 和深度學習應用程式開始使用。
AWS 如何協助滿足您的生成式 AI 和深度學習要求?
AWS AI 和深度學習服務可利用雲端運算的功能,讓您建置並擴展下一波 AI 創新。透過最全面的專用服務、AI 基礎架構、深度學習技術和生成式 AI 解決方案,顛覆客戶體驗。例如,
- Amazon SageMaker 提供完全受管理的基礎架構、工具和工作流程,用於機器學習和深度學習開發。
- Amazon Bedrock 提供單一 API,以存取和利用領先 AI 公司的各種高效能基礎模型。
您也可以使用 AWS AI 基礎設施,來存取全面、安全且經濟實惠的計算、儲存和網路,以建置 AI 應用程式。透過立即建立免費 AWS 帳戶,開始使用 AWS 上的 AI 深度學習功能。