什麼是生成式 AI?
生成式人工智慧 (亦稱生成式 AI) 是一種可以製作全新內容和想法的人工智慧,包含對話、故事、影像、影片和音樂。它可以學習人類語言、程式設計語言、藝術、化學、生物學或任何複雜的主題。它會重複運用所知來解決新的問題。
例如,生成式 AI 可以學習英語詞彙,並根據所處理的單詞來寫成一首詩。
您的組織可以將生成式 AI 用於各種目的,例如聊天機器人、媒體創作,以及產品開發和設計。
生成式 AI 範例
生成式 AI 在各個產業中有多個使用案例
金融服務
金融服務公司可使用生成式 AI 工具的強大功能,在降低成本同時為客戶提供更好的服務:
- 金融機構可以使用聊天機器人產生產品建議並回應客戶查詢,從而改善整體客戶服務。
- 貸款機構可為金融服務不足的市場 (特別是開發中國家) 快速核准貸款。
- 銀行能迅速偵測索賠、信用卡和貸款中的詐騙行為。
- 投資公司可利用生成式 AI 的強大功能,以低成本為客戶提供安全、個人化的理財建議。
醫療保健與生命科學
生成式 AI 最有前景的使用案例之一是加速藥物發現和研究。生成式 AI 可建立具有特定特性的新型蛋白質序列,以此設計抗體、酶、疫苗和基因療法。
醫療保健和生命科學公司可使用生成式 AI 工具來設計合成基因序列,以供合成生物學和代謝工程應用層面之用。例如,這些公司可以建立新的生物合成途徑或最佳化用於生物製造的基因表達。
生成式 AI 工具還可以建立合成患者和醫療保健資料。這些資料可用於訓練 AI 模型、模擬臨床試驗或研究罕見疾病,而無需存取大型真實世界資料集。
汽車與製造業
汽車公司可將生成式 AI 技術用於多種用途,從工程到車內體驗和客戶服務。例如,這些公司可以最佳化機械零件的設計以減少車輛設計中的阻力或調整輔助系統的設計。
汽車公司正在使用生成式 AI 工具,藉由快速回答最常見的客戶問題來提供更好的客戶服務。生成式 AI 可建立新材料、晶片和零件設計,以最佳化製造流程並降低成本。
另一個生成式 AI 使用案例是合成資料來測試應用程式。這對於通常未包含在測試資料集中的資料 (例如缺陷或邊緣情況) 特別有用。
電信
生成式 AI 在電信產業中的使用案例,焦點放在重新塑造客戶體驗上,這些客戶體驗是由客戶旅程所有接觸點上的累積互動來定義。
例如,電信組織可以運用生成式 AI,透過類似人類的即時對話代理程式來改善客戶服務。他們也可以透過個人化的一對一銷售助理來重新塑造客戶關係。他們還可以透過分析網路資料來推薦修復方法,從而最佳化網路效能。
媒體與娛樂
從動畫和劇本到完整電影,生成式 AI 模型僅需傳統製作所需的一小部分成本和時間,即可產生新穎內容。
創意產業其他生成式 AI 的使用案例包含:
- 藝術家可利用 AI 生成的音樂來補充及加強其專輯,創造全新體驗。
- 媒體組織可利用生成式 AI 提供個人化內容和廣告來改善觀眾體驗,藉此增加收入。
- 遊戲公司可利用生成式 AI 來開發新遊戲,並能讓玩家建立遊戲中化身。
生成式 AI 優勢
根據 Goldman Sachs 的資料,生成式 AI 可能會推動全球國內生產毛額 (GDP) 成長 7 個百分點 (或近 7 兆美元),並在 10 年內逐步將生產力成長提升 1.5 個百分點。接下來,我們將介紹生成式 AI 的更多優點。
生成式 AI 技術如何演變?
過去幾十年來,統計學中一直使用基本生成式模型來協助進行數值資料分析。神經網路和深度學習是現代生成式 AI 的最新先驅技術。2013 年開發而成的變分自動編碼器是第一個可以產生逼真影像和語音的深度生成式模型。
VAE
VAE (變動自動編碼器) 引入建立多種資料類型創新變體的功能。該功能推動其他生成式 AI 模型的迅速出現,例如生成式對抗網路和擴散模型。這些創新側重于讓產生的資料日益類似於真實資料,儘管這些資料是人為建立的。
轉換器
2017 年,隨著轉換器的推出,AI 研究發生進一步的轉變。轉換器將編碼器和解碼器架構與注意機制無縫整合。轉換器以卓越的效率和多功能性簡化語言模型的訓練過程。像 GPT 這樣的著名模型已成為基礎模型,它們能夠在廣泛的原始文字語料庫上進行預訓練,並針對不同的任務進行微調。
轉換器變革自然語言處理可能實現的功能。它們為從翻譯、摘要到回答問題等任務提供了生成式功能。
未來
許多生成式 AI 模型持續取得長足進步,並且已經形成跨行業應用。最近的創新側重于完善模型以使用專有資料。研究人員還希望建立越來越類似人類行為的文字、影像、視訊和語音。
生成式 AI 如何運作?
像所有人工智慧一樣,生成式 AI 的運作方式是使用機器學習模型,機器學習模型是依據大量資料進行預訓練的超大型模型。
基礎模型
基礎模型 (FM) 是在廣泛的廣義和未標記資料上訓練的機器學習模型。它們能夠執行各種一般任務。
FM 是數十年來不斷演進技術的最新進展成果。通常,FM 使用學習的模式和關係來預測序列中的下一個項目。
例如,在產生影像時,模型會分析影像並建立更清晰、更明確定義的影像版本。同樣,對於文字,模型會依據之前的字詞及其情境預測文字字串中的下一個字詞。後,模型使用概率分佈技術選擇下一個字詞。
大型語言模型
大型語言模型 (LLM) 是一類基礎模型。例如,OpenAI 的生成式預訓練轉換器 (GPT) 模型是 LLM。LLM 專門處理基於語言的任務,例如摘要、文字產生、分類、開放式對話和資訊擷取。
LLM 的與眾不同在於它們能夠執行多項任務。實現此功能的原因是 LLM 包含許多參數,使其能夠學習進階概念。
像 GPT-3 這樣的 LLM 可以考慮數十億個參數,並且能夠依據很少量的輸入產生內容。透過在預訓練中接觸各種形式和多種模式的網際網路規模資料,LLM 學會在各種環境中運用它們的知識。