什麼是生成式 AI?

生成式 AI 是人工智慧 (AI) 的一種類型,可以提供嶄新的內容與想法 (例如影像和影片),也可以重複利用其所知來解決新的問題。

什麼是生成式 AI?

生成式人工智慧 (亦稱生成式 AI) 是一種可以製作全新內容和想法的人工智慧,包含對話、故事、影像、影片和音樂。它可以學習人類語言、程式設計語言、藝術、化學、生物學或任何複雜的主題。它會重複運用所知來解決新的問題。

例如,生成式 AI 可以學習英語詞彙,並根據所處理的單詞來寫成一首詩。

您的組織可以將生成式 AI 用於各種目的,例如聊天機器人、媒體創作,以及產品開發和設計。

年輕企業家攜手合作新專案

生成式 AI 範例

生成式 AI 在各個產業中有多個使用案例

金融服務

金融服務公司可使用生成式 AI 工具的強大功能,在降低成本同時為客戶提供更好的服務:

  • 金融機構可以使用聊天機器人產生產品建議並回應客戶查詢,從而改善整體客戶服務。
  • 貸款機構可為金融服務不足的市場 (特別是開發中國家) 快速核准貸款。
  • 銀行能迅速偵測索賠、信用卡和貸款中的詐騙行為。
  • 投資公司可利用生成式 AI 的強大功能,以低成本為客戶提供安全、個人化的理財建議。

閱讀更多關於 AWS 生成式 AI 在金融服務領域的貢獻

金融圓餅圖

醫療保健與生命科學

生成式 AI 最有前景的使用案例之一是加速藥物發現和研究。生成式 AI 可建立具有特定特性的新型蛋白質序列,以此設計抗體、酶、疫苗和基因療法。

醫療保健和生命科學公司可使用生成式 AI 工具來設計合成基因序列,以供合成生物學和代謝工程應用層面之用。例如,這些公司可以建立新的生物合成途徑或最佳化用於生物製造的基因表達。

生成式 AI 工具還可以建立合成患者和醫療保健資料。這些資料可用於訓練 AI 模型、模擬臨床試驗或研究罕見疾病,而無需存取大型真實世界資料集。

閱讀更多關於 AWS 生成式 AI 在醫療保健和生命科學領域的貢獻

促進全球發展

汽車與製造業

汽車公司可將生成式 AI 技術用於多種用途,從工程到車內體驗和客戶服務。例如,這些公司可以最佳化機械零件的設計以減少車輛設計中的阻力或調整輔助系統的設計。

汽車公司正在使用生成式 AI 工具,藉由快速回答最常見的客戶問題來提供更好的客戶服務。生成式 AI 可建立新材料、晶片和零件設計,以最佳化製造流程並降低成本。

另一個生成式 AI 使用案例是合成資料來測試應用程式。這對於通常未包含在測試資料集中的資料 (例如缺陷或邊緣情況) 特別有用。

閱讀更多關於 AWS 上適用於汽車業的生成式 AI

閱讀更多關於 AWS 上適用於製造葉的生成式 AI

汽車與製造業

電信

生成式 AI 在電信產業中的使用案例,焦點放在重新塑造客戶體驗上,這些客戶體驗是由客戶旅程所有接觸點上的累積互動來定義。

例如,電信組織可以運用生成式 AI,透過類似人類的即時對話代理程式來改善客戶服務。他們也可以透過個人化的一對一銷售助理來重新塑造客戶關係。他們還可以透過分析網路資料來推薦修復方法,從而最佳化網路效能。 

閱讀更多關於 AWS 上適用於電信公司的生成式 AI

電信

媒體與娛樂

從動畫和劇本到完整電影,生成式 AI 模型僅需傳統製作所需的一小部分成本和時間,即可產生新穎內容。

創意產業其他生成式 AI 的使用案例包含:

  • 藝術家可利用 AI 生成的音樂來補充及加強其專輯,創造全新體驗。
  • 媒體組織可利用生成式 AI 提供個人化內容和廣告來改善觀眾體驗,藉此增加收入。
  • 遊戲公司可利用生成式 AI 來開發新遊戲,並能讓玩家建立遊戲中化身。
媒體與娛樂

生成式 AI 優勢

根據 Goldman Sachs 的資料,生成式 AI 可能會推動全球國內生產毛額 (GDP) 成長 7 個百分點 (或近 7 兆美元),並在 10 年內逐步將生產力成長提升 1.5 個百分點。接下來,我們將介紹生成式 AI 的更多優點。
生成式 AI 演算法可透過多種嶄新的方式探索和分析複雜的資料,讓研究人員發現潛在的嶄新趨勢和模式。這些演算法可以彙總內容,概述多種解決方案路徑,集思廣益,並依據研究筆記建立詳細的文件。這就是生成式 AI 可極大地增強研究和創新的原因所在。例如,製藥產業正在使用生成式 AI 系統來產生和最佳化蛋白質序列,並顯著加快推進藥物發現。
生成式 AI 可以自然地回應人類對話,並作為客戶服務和客戶工作流程個人化的工具。例如,您可以使用 AI 支援的聊天機器人、語音機器人和虛擬助理,更準確地回應客戶以在第一次接觸時就解決問題。他們可以透過以個人化的方式呈現精選的服務和溝通內容來提高客戶參與度。

使用生成式 AI,企業可以利用機器學習 (ML) 和 AI 應用程式在所有業務領域最佳化業務流程。可以將此技術運用於所有業務範圍,包括工程、行銷、客戶服務、金融和銷售。

例如,以下是生成式 AI 可以執行的最佳化:

  • 從任何來源擷取和彙總資料以用於知識搜尋功能。
  • 評估和最佳化行銷、廣告、財務和物流等領域的不同成本降低方案。
  • 產生合成資料以建立帶標籤的資料,用於監督式學習和其他 ML 程序。

生成式 AI 模型可以增強員工的工作流程,並且充當組織中每個人的高效助手。它們可以採用類似人類的方式完成從搜尋到建立的所有任務。生成式 AI 可以提高不同類型員工的工作效率:

     
  • 依據特定的輸入和約束條件產生多個原型,從而支援創意任務。該技術還可以依據人工意見回饋和指定約束條件最佳化現有設計。
  • 針對應用程式開發任務產生新的軟體程式碼建議
  • 透過產生報告、摘要和預測來支援管理。
  • 為行銷團隊產生新的銷售指令碼、電子郵件內容和部落格。

可以節省時間、降低成本並提高整個組織的效率。

生成式 AI 技術如何演變?

過去幾十年來,統計學中一直使用基本生成式模型來協助進行數值資料分析。神經網路和深度學習是現代生成式 AI 的最新先驅技術。2013 年開發而成的變分自動編碼器是第一個可以產生逼真影像和語音的深度生成式模型。

VAE

VAE (變動自動編碼器) 引入建立多種資料類型創新變體的功能。該功能推動其他生成式 AI 模型的迅速出現,例如生成式對抗網路和擴散模型。這些創新側重于讓產生的資料日益類似於真實資料,儘管這些資料是人為建立的。

生成式 AI 模型

轉換器

2017 年,隨著轉換器的推出,AI 研究發生進一步的轉變。轉換器將編碼器和解碼器架構與注意機制無縫整合。轉換器以卓越的效率和多功能性簡化語言模型的訓練過程。像 GPT 這樣的著名模型已成為基礎模型,它們能夠在廣泛的原始文字語料庫上進行預訓練,並針對不同的任務進行微調。

轉換器變革自然語言處理可能實現的功能。它們為從翻譯、摘要到回答問題等任務提供了生成式功能。

生成式 AI 區塊

未來

許多生成式 AI 模型持續取得長足進步,並且已經形成跨行業應用。最近的創新側重于完善模型以使用專有資料。研究人員還希望建立越來越類似人類行為的文字、影像、視訊和語音。

生成式 AI 的未來

生成式 AI 如何運作?

像所有人工智慧一樣,生成式 AI 的運作方式是使用機器學習模型,機器學習模型是依據大量資料進行預訓練的超大型模型。

基礎模型

基礎模型 (FM) 是在廣泛的廣義和未標記資料上訓練的機器學習模型。它們能夠執行各種一般任務。

FM 是數十年來不斷演進技術的最新進展成果。通常,FM 使用學習的模式和關係來預測序列中的下一個項目。

例如,在產生影像時,模型會分析影像並建立更清晰、更明確定義的影像版本。同樣,對於文字,模型會依據之前的字詞及其情境預測文字字串中的下一個字詞。後,模型使用概率分佈技術選擇下一個字詞。

大型語言模型

大型語言模型 (LLM) 是一類基礎模型。例如,OpenAI 的生成式預訓練轉換器 (GPT) 模型是 LLM。LLM 專門處理基於語言的任務,例如摘要、文字產生、分類、開放式對話和資訊擷取。

閱讀有關 GPT 的內容 »

LLM 的與眾不同在於它們能夠執行多項任務。實現此功能的原因是 LLM 包含許多參數,使其能夠學習進階概念。

像 GPT-3 這樣的 LLM 可以考慮數十億個參數,並且能夠依據很少量的輸入產生內容。透過在預訓練中接觸各種形式和多種模式的網際網路規模資料,LLM 學會在各種環境中運用它們的知識。

生成式 AI 模型如何運作?

傳統的機器學習模型具有辨別性,或者側重於對資料點進行分類。它們嘗試確定已知因素和未知因素之間的關係。例如,這些模型檢視影像,即圖元排列、線條、顏色和形狀等已知資料,然後將它們映射到字詞,即未知因素。從數學上講,這些模型的運作方式是識別可以用數值方式將未知和已知因素映射為 x 和 y 變數的方程。生成式模型在此基礎上更進一步。這些模型不是在給定某些特徵的情況下預測標籤,而是在給定特定標籤的情況下嘗試預測特徵。從數學上講,生成式建模計算 x 和 y 同時出現的概率。該模型學習不同資料特徵的分佈及其關係。例如,生成式模型分析動物影像以記錄變數,例如不同的耳朵形狀、眼睛形狀、尾巴特徵和皮膚圖案。這些模型學習特徵及其關係,以了解不同動物的總體外觀。然後,它們可以重新建立訓練集中沒有的新動物影像。接下來,我們給出幾大類生成式 AI 模型。

擴散模型

擴散模型透過對初始資料樣本進行反覆運算性的受控隨機變更來建立新資料。這些模型以原始資料為起點,然後加入細微的變化 (雜訊),逐漸使其與原始資料不那麼相似。這種雜訊經過精心控制,以確保產生的資料保持一致且逼真。

在多次反覆運算中新增雜訊之後,擴散模型反轉該程序。反向消噪會逐漸消除雜訊,以產生類似原始資料的新資料樣本。

擴散模型

生成式對抗網路

生成式對抗網路 (GAN) 是另一個以擴散模型概念為基礎的生成式 AI 模型。

GAN 透過以競爭性的方式訓練兩個神經網路來運作。第一個網路稱為產生器,透過新增隨機雜訊來產生虛假的資料樣本。第二個網路稱為鑑別器,其嘗試區分真實資料和產生器產生的虛假資料。 

在訓練過程中,產生器不斷提高其建立逼真資料的能力,而鑑別器日益加強區分真假資料的能力。這種對抗過程一直持續到產生器產生的資料令人信服,以至於鑑別器無法將其與真實資料區分。

GAN 廣泛用於產生逼真的影像,風格轉換和資料增強任務。

生成式對抗網路

变分自动编码器

變動自動編碼器 (VAE) 學習稱為「潛在空間」的資料緊湊表示。潛在空間是資料的數學表示。可以將潛在空間視為唯一的程式碼,根據資料的所有屬性來表示資料。例如,如果研究面部,則潛在空間包含代表眼睛形狀、鼻子形狀、顴骨和耳朵的數字。

VAE 使用兩個神經網路 — 編碼器和解碼器。編碼器神經網路將輸入資料映射為潛在空間每個維度的均值和方差。該神經網路從高斯 (正態) 分佈中產生隨機樣本。此樣本是潛在空間中的一個點,表示輸入資料的壓縮簡化版本。

解碼器神經網路從潛在空間中取得此取樣點,然後將其重新建構回與原始輸入相似的資料。使用數學函數衡量重新建構的資料與原始資料的相符程度。

变分自动编码器

以轉換器為基礎的模型

以轉換器為基礎的生成式 AI 模型建立在 VAE 的編碼器和解碼器概念之上。以轉換器為基礎的模型為編碼器新增更多層,以提高理解、翻譯和創意寫作等文字式任務的處理效能。

以轉換器為基礎的模型使用自注意力機制。在處理序列中的每個元素時,這些模型權衡輸入序列中不同部分的重要性。

另一個關鍵功能是這些 AI 模型實作情境嵌入。序列元素的編碼不僅取決於元素本身,還取決於其序列中的情境。

以轉換器為基礎的模型如何運作

要理解基於轉換器的模型如何運作,可以將語句想像成字詞序列。

自注意力可以協助模型在處理每個字詞時將注意力集中在相關的字詞上。為擷取字詞之間不同類型的關係,基於轉換器的生成式 AI 採用稱為「注意力頭」的多個編碼器層。每個「注意力頭」會學著了解輸入序列的不同部分,使模型能同時顧及資料的各個面向。

每一層會再改善情境嵌入,使模型具更豐富的資訊,並捕捉語法到複雜語義的所有內容。

以轉換器為基礎的模型

初學者的生成式 AI 培訓

生成式 AI 培訓從瞭解基礎的機器學習概念開始。學習者也必須探索神經網路和 AI 架構。擁有 Python 程式庫 (例如 TensorFlow 或 PyTorch) 的實務經驗,對於實作和實驗不同模型而言是相當重要的經驗。您也必須學習模型評估、微調和提示詞工程技能。

人工智慧或機器學習領域的學位可提供深度培訓。參加線上短期課程與認證,讓專業發展如虎添翼。在 AWS 上的生成式 AI 培訓包含由 AWS 專家就以下主題所提供的認證:

 

初學者的生成式 AI 培訓

生成式 AI 的限制是什麼?

儘管生成式 AI 系統不斷進步,但有時可能會生成錯誤或誤導性的資訊。因為這類系統仰賴他們被投餵的模式和資料,可以反映資料中存在的偏見或錯誤。其他與資料訓練相關的問題包括

安全性

如果以專屬資料自訂生成式 AI 模型,則會產生資料隱私權和安全問題。我們必須確保生成式 AI 工具產生的回應能防止未授權存取專屬資料。如果 AI 模型的決策方式既草率又缺乏透明度,也會導致安全性問題。
了解使用 AWS 生成式 AI 的安全方法

創造力

生成式 AI 雖然可以產生創意內容,但通常缺乏真正的原創性。AI 的創造力受訓練資料限制,因此可能生成重複或相似的輸出內容。人類創造力涉及更深入的理解和情緒共鳴,對 AI 而言,要複製這方面特性仍具挑戰。

費用

訓練和執行生成式 AI 模型需要大量的運算資源。相較於從零開始建置新模型,雲端生成式 AI 模型更容易取得且划算。

可解釋

由於其複雜和高深莫測的特性,生成式 AI 模型通常被視為「黑盒子」。要了解這些模型如何產生特定輸出內容也不簡單。如果要增加信任和普及率,就需要提高模型的可解釋性和透明度。

生成式 AI 的採用有哪些最佳實務?

如果組織想要實作生成式 AI 解決方案,請考慮採用以下最佳實務來強化工作。
最好從內部應用程式開發開始採用生成式 AI,重點關注程序優化和員工生產效率提升。可以取得更加可控的環境來測試結果,同時培養技能和理解相關技術。可以廣泛測試模型,甚至可以在內部知識來源上自訂模型。如此一來,在最終將這些模型用於外部應用程式時,客戶將享受更理想的體驗。
就所有生成式 AI 應用程式和輸出進行清晰的溝通,這樣使用者就可知道他們正在與 AI 而非人類進行互動。例如,AI 可以自我介紹為人工智慧,或者可以標記和突出顯示以人工智慧為基礎的搜尋結果。這樣,使用者就可以在與內容互動時自行做出判斷。他們還可以更主動地處理基礎模型可能存在的任何不準確或隱藏的偏差 (由於訓練資料的局限性)。
實作防護機制,從而生成式 AI 應用程式不會允許無意中未經授權存取敏感性資料。讓安全團隊從一開始參與進來,這樣就可在啟動時考慮所有方面。例如,在依據內部資料訓練任何模型之前,您可能必須遮罩資料並移除個人身分識別資訊 (PII)。
開發自動和手動測試程序來驗證結果,以及測試生成式 AI 系統可能遇到的所有類型場景。讓不同的測試版測試人員群組以不同的方式試用應用程式並記錄結果。該模型還將透過測試不斷改進,並且您可以更全面地控制預期結果和回應。

常見問答集

基礎模型是以各式各樣的文字和影像資料來訓練的大型生成式 AI 模型。這些模型能夠執行各種一般任務,例如回答問題,撰寫論文,以及為影像下標題。
隨著深度學習在 2010 年代末期的長足進展,生成式 AI 也隨之嶄露頭角,在 Generative Adversarial Networks (GAN) 和轉換器這一類模型方面尤其如此。雲端運算自 2022 年以來的進展,讓生成式 AI 能實質應用在商業環境中,也更容易取得。
人工智慧泛指讓機器更為人性化的概念。從智慧助理如 Alexa、聊天機器人和影像生成器到掃地機器人和自動駕駛汽車,這些都屬於 AI。生成式 AI 則是此概念下的其中一個領域,能夠以有意義、有智慧的方式生成新的內容。