Amazon Polly 常見問答集
一般問題
問:什麼是 Amazon Polly?
Amazon Polly 是將文字轉換成逼真說話方式的服務。您可以透過 Amazon Polly 讓現有應用程式以說話作為首要功能,以便您開發具備語音功能的全新類型產品,從行動應用程式和汽車到裝置與設備,各種產品都能使用。Amazon Polly 包含了數十種逼真的語音且支援多種語言,因此您可以選取適當的語音,然後在多個地理區域分發啟用語音功能的應用程式。Amazon Polly 簡單易用,只要將想要轉換為語音的文字傳送至 Amazon Polly API,Amazon Polly 就會立即將音訊串流傳回應用程式,您便可以直接播放,或是以標準音訊檔案格式存放,例如 MP3。Amazon Polly 支援 prosody 等語音合成標記語言 (SSML) 標籤,方便您調整語速、音調或音量。Amazon Polly 服務安全無虞,可以大規模且低延遲的提供所有優點。快取和重新播放 Amazon Polly 產生的語音無須另外付費。註冊後第一年,Amazon Polly 每月可供您免費轉換數百萬個字元。Amazon Polly 的按用量付費定價方式、每個請求的成本非常低廉,且不限制語音輸出的儲存和重複使用,在任何地方啟用合成語音功能都是經濟實惠的方式。
問:為什麼應該使用 Amazon Polly?
您可以利用 Amazon Polly 為應用程式提供高品質的語音輸出功能。這個經濟實惠的服務所需的回應時間極短,幾乎適用於各種使用案例,而且存放及重複使用產生的語音沒有任何相關限制。
問:提供哪些功能?
您可以使用標準化語音合成標記語言 (SSML) 控制語音的各個方面,例如發音、音量、 聲調、語音速度等。您可以使用新聞播報員風格合成特定神經語音的聲音,使其聽起來就像電視或電台新聞播報員一樣。您可以根據音訊串流中所含的中繼資料偵測對使用者說出文字中特定字詞或句子的時機。這可讓開發人員同步圖形反白顯示和動畫,例如將虛擬人物的唇形與合成語音同步。您還可以使用自訂語彙修改特定字詞的發音,例如公司名稱、縮寫、外文字詞與新詞,例如,以法文以外的語音說出 "P!nk"、"ROTFL"、"C'est la vie"。
問:什麼是語音標記?
語音標記旨在補充輸入文字產生之合成語音的不足之處。使用此中繼資料搭配合成語音音訊串流,客戶即可為自己的應用程式提供增強的視覺體驗,像是語音同步動畫或卡拉 OK 式反白顯示。
Amazon Polly 使用下列四個元素產生語音標記:
- 句子,指出輸入文字中要說出的句子元素;
- 字詞,指出文字中的字詞元素;
- 發音嘴型,描述與說出的聲音對應的唇形;
- SSML,描述文字中使用的 SSML 元素。
使用合成語音方法搭配語音標記類型參數時,會以 JSON 串流的形式 (具體來說,就是由新的行分隔的一組獨立 JSON 物件) 交付語音標記,其中可包含一到全部四個元素。您可以在 Amazon Polly Developer Guide 找到更多詳細資訊。
問:這項服務的最常用案例有哪些?
您可以使用 Amazon Polly 為應用程式增添逼真的語音功能,使應用程式栩栩如生。舉例來說,在電子學習及教育中,您可以利用 Amazon Polly 的文字轉換語音 (TTS) 功能建立應用程式來協助有閱讀障礙的使用者。Amazon Polly 可用來協助盲人和視障人士閱讀數位內容 (電子書、新聞等)。Amazon Polly 可用於公共運輸及工廠控制系統的廣播系統,用來發佈通知與緊急宣告。此外,機上盒、智慧型手錶、平板電腦、智慧型手機與 IoT 裝置等各式各樣的裝置都可以利用 Amazon Polly 提供音訊輸出。您也可以在電話語音解決方案中使用 Amazon Polly,為互動式語音回應系統提供語音。而問答遊戲、動畫、虛擬人偶或旁白產生等應用程式也是 Amazon Polly 這類雲端 TTS 解決方案的常用案例。
問:這個產品如何搭配其他 AWS 產品使用?
結合 Amazon Lex,開發人員可為自家應用程式建立發展成熟的語音使用者界面。在 Amazon Connect 內,Amazon Polly 語音可用來建立自助服務的雲端聯絡中心服務。除此之外,行動應用程式與物聯網 (IoT) 解決方案的開發人員還能利用 Amazon Polly 為自家系統新增語音輸出。
問:比起裝置型文字轉換語音解決方案,雲端型有哪些優勢?
裝置型文字轉換語音解決方案的裝置需要強大的運算資源、高效能 CPU、RAM 與磁碟空間。這不但導致開發成本提高,而且平板電腦與智慧型手機等裝置也會耗費更多電力。相較之下,在雲端完成的文字轉換語音這種轉換方式可大幅降低本機資源需求,還能以最佳品質支援所有可用語言與語音。此外,您可即時針對所有終端使用者進行語音修正與功能強化,不需為所有裝置進行額外更新就能完成。雲端文字轉換語音 (TTS) 獨立於任何平台之外,因此可以將所需的開發時間與工作降到最低。
問:如何開始使用 Amazon Polly?
只要登入您的 AWS 帳戶,並導覽至 Amazon Polly 主控台 (位於 AWS 主控台中),就能使用該主控台輸入任何文字,聆聽產生的語音,或將其儲存為語音檔案。
問:這項服務在哪些區域提供?
請參閱 AWS 區域服務清單,了解支援 Amazon Polly 標準語音的所有區域。下列區域的以下子集支援神經語音:美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、加拿大 (中部)、亞太區域 (東京)、亞太區域 (首爾)、亞太區域 (新加坡),亞太區域 (雪梨)、非洲 (開普敦)、歐洲 (倫敦)、歐洲 (法蘭克福)、歐洲 (愛爾蘭) 和 AWS GovCloud (美國西部)。
問:支援哪些程式設計語言?
Amazon Polly 支援 AWS 開發套件 (Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++) 與 AWS Mobile SDK (iOS/Android) 中的所有程式設計語言。此外,Amazon Polly 也支援 HTTP API,方便您自行實作存取層。
問:支援哪些音訊格式?
使用 Amazon Polly,您可以以近乎即時的速度將音訊串流給使用者。您有多種抽樣頻率可選擇,讓您針對應用程式優化頻寬與音訊品質。Amazon Polly 支援 MP3、Vorbis 和原始 PCM 音訊串流格式。
問:Amazon Polly 是否有 AWS 服務限制?
為了保證 AWS 資源的可用性和盡量降低新客戶的帳單風險,AWS 會維持每個帳戶的服務限制。使用 Amazon Polly 支援應用程式的高品質語音輸出時會有多個預設服務限制,包含使用調節、操作和語音合成標記語言 (SSML) 的限制。如需詳細資訊,請參閱 Amazon Polly Developer Guide 中的 Limits in Amazon Polly。結合 Amazon Polly 和 AWS Batch 等其他 AWS 服務可提升批次處理的效率,以協助您在這些服務限制內充分利用 Amazon Polly。
問:Amazon Polly 是否獲得 HIPAA 認證?
答:Amazon Polly 是 AWS 商業夥伴增補合約 (AWS BAA) 下涵蓋的 HIPAA 合格服務。如果您擁有 AWS BAA,Amazon Polly 只會依照 AWS BAA 條款允許的方式使用、公開和維護您的受保護醫療資訊 (PHI),而不是依照 Amazon Polly 常見問答集資料隱私權部分所指定的方式。
計費
問:Amazon Polly 的費用是多少?
請參閱 Amazon Polly 定價頁面了解最新的定價資訊。
問:是否可以使用這項服務產生需要多次重播的靜態語音提示?
是,可以這麼做。這項服務對這類使用方式沒有任何限制,也不會收取額外的費用。
問:是否可以使用這項服務來產生內容,以供大規模通知系統 (例如火車站) 使用?
是,可以這麼做。這項服務對這類使用方式沒有任何限制,也不會收取額外的費用。
問:如果我請求合成 1,000 個字元並在這 1,000 字元中請求語音標記,是否需要支付 2,000 個字元的費用?
是。我們會按照您傳送到服務的字元數,向您收取每個語音或語音標記請求的費用。
問:Amazon Polly 是否包含在 AWS 免費方案內?
是,此為 AWS 免費用量方案的一部分,您可以免費開始使用 Amazon Polly。註冊後,新 Amazon Polly 客戶可以在前 12 個月,每月免費合成數百萬個字元。請參閱 Amazon Polly 定價頁面了解最新的定價資訊。
資料隱私權
問:是否會存放 Amazon Polly 處理的文字輸入?AWS 如何使用這些內容?
Amazon Polly 可能會存放及使用服務所處理的文字輸入,這些輸入僅用於提供及維護服務,以及開發 Amazon Polly 和其他 Amazon 機器學習/人工智慧技術並改善品質。為了持續改善 Amazon Polly 客戶體驗 (包括開發及訓練相關技術),使用您的內容很重要。不過,我們不會使用內容中的任何個人識別資訊,為產品和服務尋找目標客群,或向您或您的最終使用者行銷產品或服務。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作適當且複雜的技術和實體控制 (包括靜態加密和傳輸加密),旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 https://aws.amazon.com/compliance/data-privacy-faq/。您可以使用 AWS Organizations 退出政策,選擇退出使用您的內容改善和開發 Amazon Polly 和其他 Amazon 機器學習/人工智慧技術的品質。如需如何退出的資訊,請參閱管理 AI 服務退出政策。
問:哪些人可以存取 Amazon Polly 所處理及存放的內容?
只有得到授權的員工可以存取 Amazon Polly 所處理的內容。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作適當且複雜的技術和實體控制 (包括靜態加密和傳輸加密),旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 https://aws.amazon.com/compliance/data-privacy-faq/。
問:我是否仍擁有經過 Amazon Polly 處理及存放的內容?
您會永久保有自己內容的擁有權,而且我們只會在取得同意的情況下,才使用您的內容。
問:Amazon Polly 處理的內容是否會移出我使用 Amazon Polly 的 AWS 區域?
Amazon Polly 處理的任何內容都會經過加密,並靜態存放在您使用 Amazon Polly 的 AWS 區域中。Amazon Polly 處理的部分內容可能會存放在其他 AWS 區域,僅用於繼續改善及開發 Amazon Polly 客戶使用體驗和其他 Amazon 機器學習/人工智慧技術。您可能會選擇聯絡 AWS Support 來讓我們使用您的內容,來改善和開發 Amazon Polly 和其他 Amazon 機器學習/人工智慧技術的品質,您的內容將不會存放在另一個 AWS 區域中。我們將您的信任、您內容的隱私和安全性放在第一優先,而且實作適當且複雜的技術和實體控制 (包括靜態加密和傳輸加密),旨在避免未授權人員存取或公開您的內容,同時確保對內容的使用絕對遵守我們對您所做的承諾。如需詳細資訊,請參閱 https://aws.amazon.com/compliance/data-privacy-faq/。
問:我是否可以在針對 13 歲以下兒童且受兒童線上隱私保護法令 (COPPA) 規範的網站、程式或其他應用程式上使用 Amazon Polly?
是,您必須遵守 Amazon Polly 服務條款的規範,包括您有義務依據 COPPA 提供任何必要的通知和取得任何必要的可查證家長同意,如此即可在針對 13 歲以下兒童的全部或部分網站、程式或其他應用程式使用 Amazon Polly。