試用 Amazon Polly

註冊取得免費帳戶
或者,請登入主控台

Amazon Polly 免費方案包含每月 500 萬個字元,從第一次文字轉語音的要求起算可使用 12 個月。

查看 AWS 免費方案詳細資訊 »


問:什麼是 Amazon Polly?

Amazon Polly 是將文字轉換成逼真說話方式的服務。您可以透過 Amazon Polly 讓現有應用程式以說話作為首要功能,以便您開發具備語音功能的全新類型產品,從行動應用程式和汽車到裝置與設備,各種產品都能使用。Amazon Polly 包含了數十種逼真的語音且支援多種語言,因此您可以選取適當的語音,然後在多個地理區域分發啟用語音功能的應用程式。Amazon Polly 簡單易用,只要將想要轉換為語音的文字傳送至 Amazon Polly API,Amazon Polly 就會立即將音訊串流傳回應用程式,您便可以直接播放,或是以標準音訊檔案格式存放,例如 MP3。Amazon Polly 支援 prosody 等語音合成標記語言 (SSML) 標籤,方便您調整語速、音調或音量。Amazon Polly 服務安全無虞,可以大規模且低延遲的提供所有優點。快取和重新播放 Amazon Polly 產生的語音無須另外付費。註冊後第一年,Amazon Polly 每月可供您免費轉換 5 百萬個字元。Amazon Polly 的按用量付費定價方式、每個請求的成本非常低廉,且不限制語音輸出的儲存和重複使用,在任何地方啟用合成語音功能都是經濟實惠的方式。

問:為什麼應該使用 Amazon Polly?

您可以利用 Amazon Polly 為應用程式提供高品質的語音輸出功能。這個經濟實惠的服務所需的回應時間極短,幾乎適用於各種使用案例,而且存放及重複使用產生的語音沒有任何相關限制。

問:提供哪些功能?

您可以使用標準化語音合成標記語言 (SSML) 控制語音的各種設定,例如發音、音量、音調、語速等。您可以根據音訊串流中所含的中繼資料偵測對使用者說出文字中特定字詞或句子的時機。這可讓開發人員同步圖形反白顯示和動畫,例如將虛擬人物的唇形與合成語音同步。您還可以使用自訂語彙修改特定字詞的發音,例如公司名稱、縮寫、外文字詞與新詞 (例如,以法文以外的語音說出 "P!nk"、"ROTFL"、"C'est la vie")。

問:什麼是語音標記?

語音標記旨在補充輸入文字產生之合成語音的不足之處。使用此中繼資料搭配合成語音音訊串流,客戶即可為自己的應用程式提供增強的視覺體驗,像是語音同步動畫或卡拉 OK 式反白顯示。

Amazon Polly 使用下列四個元素產生語音標記:

1) 句子,指出輸入文字中要說出的句子元素;

2) 字詞,指出文字中的字詞元素;

3) 發音嘴型,描述與說出的聲音對應的唇形;

4) SSML,描述文字中使用的 SSML 元素。

使用合成語音方法搭配語音標記類型參數時,會以 JSON 串流的形式 (具體來說,就是由新的行分隔的一組獨立 JSON 物件) 交付語音標記,其中可包含一到全部四個元素。您可以在 Amazon Polly Developer Guide 找到更多詳細資訊。

問:這項服務的最常用案例有哪些?

您可以使用 Amazon Polly 為應用程式增添逼真的語音功能,使應用程式栩栩如生。舉例來說,在電子學習及教育中,您可以利用 Amazon Polly 的文字轉換語音 (TTS) 功能建立應用程式來協助有閱讀障礙的使用者。Amazon Polly 可用來協助盲人和視障人士閱讀數位內容 (電子書、新聞等)。Amazon Polly 可用於公共運輸及工廠控制系統的廣播系統,用來發佈通知與緊急宣告。此外,機上盒、智慧型手錶、平板電腦、智慧型手機與 IoT 裝置等各式各樣的裝置都可以利用 Amazon Polly 提供音訊輸出。您也可以在電話語音解決方案中使用 Amazon Polly,為互動式語音回應系統提供語音。而問答遊戲、動畫、虛擬人偶或旁白產生等應用程式也是 Amazon Polly 這類雲端 TTS 解決方案的常用案例。

問:這個產品如何搭配其他 AWS 產品使用?

結合 Amazon Lex 時,開發人員可為自家應用程式建立發展成熟的語音使用者界面。在 Amazon Connect 內,Amazon Polly 語音可用來建立自助服務的雲端聯絡中心服務。除此之外,行動應用程式與物聯網 (IoT) 解決方案的開發人員還能利用 Amazon Polly 為自家系統新增語音輸出。

問:比起裝置型文字轉換語音解決方案,雲端型有哪些優勢?

裝置型文字轉換語音解決方案的裝置需要強大的運算資源、高效能 CPU、RAM 與磁碟空間。這不但導致開發成本提高,而且平板電腦與智慧型手機等裝置也會耗費更多電力。相較之下,在雲端完成的文字轉換語音這種轉換方式可大幅降低本機資源需求,還能以最佳品質支援所有可用語言與語音。此外,您可即時針對所有終端使用者進行語音修正與功能強化,不需為所有裝置進行額外更新就能完成。雲端文字轉換語音 (TTS) 獨立於任何平台之外,因此可以將所需的開發時間與工作降到最低。

問:如何開始使用 Amazon Polly?

只要登入您的 AWS 帳戶,並導覽至 Amazon Polly 主控台 (位於 AWS 主控台中),就能使用該主控台輸入任何文字,聆聽產生的語音,或將其儲存為語音檔案。

問:這項服務在哪些區域提供?

您可以從以下全球 14 個 AWS 區域存取 Amazon Polly:亞太區域 (孟買)、亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (東京)、加拿大 (中部)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、南美洲 (聖保羅)、美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)。

問:支援哪些程式設計語言?

Amazon Polly 支援 AWS 開發套件 (Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++) 與 AWS Mobile SDK (iOS/Android) 中的所有程式設計語言。此外,Amazon Polly 也支援 HTTP API,方便您自行實作存取層。

問:支援哪些音訊格式?

使用 Amazon Polly,您可以以近乎即時的速度將音訊串流給使用者。您有多種抽樣頻率可選擇,讓您針對應用程式優化頻寬與音訊品質。Amazon Polly 支援 MP3、Vorbis 和原始 PCM 音訊串流格式。

問:支援哪些語言?

美國英文 荷蘭文 韓文 美國西班牙文
澳洲英文 法文 波蘭文 瑞典文
英國英文 加拿大法文
葡萄牙文 土耳其文
印度英文 德文 巴西葡萄牙文
挪威文
威爾斯英文 冰島文 羅馬尼亞文  
威爾斯文 義大利文 俄文
  
丹麥文 日文 標準西班牙文
 

問:Amazon Polly 是否有 AWS 服務限制?

為了保證 AWS 資源的可用性和盡量降低新客戶的帳單風險,AWS 會維持每個帳戶的服務限制。使用 Amazon Polly 支援應用程式的高品質語音輸出時會有多個預設服務限制,包含使用調節、操作和語音合成標記語言 (SSML) 的限制。如需詳細資訊,請參閱 Amazon Polly Developer Guide 中的 Limits in Amazon Polly。結合 Amazon Polly 和 AWS Batch 等其他 AWS 服務可提升批次處理的效率,以協助您在這些服務限制內充分利用 Amazon Polly。


問:Amazon Polly 的費用是多少?

請參閱 Amazon Polly 定價頁面了解最新的定價資訊。

問:是否可以使用這項服務產生需要多次重播的靜態語音提示?

是,可以這麼做。這項服務對這類使用方式沒有任何限制,也不會收取額外的費用。

問:是否可以使用這項服務來產生內容,以供大規模通知系統 (例如火車站) 使用?

是,可以這麼做。這項服務對這類使用方式沒有任何限制,也不會收取額外的費用。

問:如果我請求合成 1,000 個字元並在這 1,000 字元中請求語音標記,是否需要支付 2,000 個字元的費用?

是。我們會按照您傳送到服務的字元數,向您收取每個語音或語音標記請求的費用。

問:Amazon Polly 是否包含在 AWS 免費方案內?

是,此為 AWS 免費用量方案的一部分,您可以免費開始使用 Amazon Polly。註冊後,新 Amazon Polly 客戶可以在前 12 個月每月免費合成最多 5 百萬個字元。

問:價格含稅嗎?

如需稅務的詳細資訊,請參閱 Amazon Web Services 稅務說明


問:Amazon Polly 是否會使用我的內容來改善服務?Amazon Polly 的隱私權政策為何?

Amazon Polly 可能使用您的內容,用於改進我們的服務產品以及 AWS 及其關係企業提供的其他機器學習相關產品及服務的品質。使用您的內容對於進一步開發基礎技術及改進 Amazon Polly 客戶體驗而言非常重要。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作可靠且複雜的技術和實體控制,旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 AWS 資料隱私權常見問答集。