什麼是 Amazon Polly?
Amazon Polly 是一項全受管服務,可隨需產生語音,將任何文字轉換為音訊串流。使用深度學習技術轉換文章、網頁、PDF 文件和其他文字轉換語音 (TTS)。Polly 提供多種語言的數十種逼真語音,您可用來打造參與並轉化的語音啟動應用程式。滿足各地理區域和市場使用者的各種語言、可存取性和學習需求。強大的神經網路和生成式語音引擎在背景工作,為您合成語音。將 Amazon Polly API 整合到現有的應用程式,快速做好語音準備。
使用案例
產生數十種語言的語音。
將語音新增至擁有全球受眾的應用程式,例如 RSS 摘要、網站或影片。讓您的行動裝置和 IoT 應用程式為未來做好語音準備。
進一步了解語音的產生。
以自然的聲音與客戶互動
透過互動式或自動語音回應系統儲存和重播 Amazon Polly 語音輸出,以提示來電者。使用 AI 功能產生可與客戶情感交流的語音。
以一小部分的成本為媒體建立音訊
直接從指令碼建立動畫、遊戲和其他媒體的配音。使用 W3C 標準 XML 型標記語言 SSML 來調整語調、重音與音調以符合場景。自動調整語音持續時間以便進行多語言配音。
功能
Amazon Polly 具有多種功能,包括下方列出的一些功能
逼真的聲音
在持續快速的回應時間內,提供交談式使用者體驗
請求 Amazon Polly 輸出時,您可以從數十種逼真的語音和各種語言中進行選擇。每個語音都是使用母語人士建立的,即使是同一種語言也有語音的變化。大多數語言都包含一或多個男性和女性語音,因此您可以選擇最適合您的使用案例的語音。

可自訂輸出
視需要自訂和控制語音輸出
Amazon Polly 可讓您建立自訂文字轉換語音輸出,吸引並留住觀眾的注意力。使用自訂詞彙來修改縮寫、公司名稱、內部術語或您選擇的任何其他單詞的發音。Amazon Polly 的語音合成標記語言 (SSML) 標籤還可讓您調整重音、音調、語調和風格。產生最適合您業務的語音 AI 輸出。

控制和安全
以標準格式安全地儲存和轉散佈語音
將文字轉換語音輸出儲存在標準音訊檔案 (例如 MP3 和 OGG) 中,以便用於轉散佈、分析、封存或任何其他使用案例,無需額外費用。如果需要,快取檔案以便更快地擷取。您的內容的安全、信任和隱私權是 AWS 的首要任務。Amazon Polly 不會保留您提交文字的內容。

常見問答集