Amazon Polly 入門

Amazon Polly 是將文字轉換成逼真說話方式的服務,能夠讓您建立會說話的應用程式和打造全新的啟用語音產品類別。Amazon Polly 是運用先進深度學習技術的文字轉換語音服務,合成語音聽起來就像真人發音一樣。

它提供多種語言的數十種逼真語音,您可以選取最合適的語音來建立多國使用並啟用語音功能的應用程式。

語言 女性 男性 範例文字
英文 Joanna Matthew Hello. Do you speak a foreign language? One language is never enough.
丹麥文 Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
巴西葡萄牙文 Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
西班牙文 Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
日文 Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
韓文 Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。

這裡查看 Amazon Polly 語音和支援語言的完整清單。


日期

標題

作者

2017 年 11 月 9 日 Modify the Timbre of Amazon Polly Voices with the New Vocal Tract SSML Feature Amazon Polly 資深產品經理 Robin Dautricourt

2017 年 10 月 19 日

Convert Your Text into an MP3 File with Amazon Polly and a Simple Python Script AWS 資料科學家 Dzidas Martinaitis

2017 年 10 月 12 日

Amazon Polly Expands to the Asia Pacific (Tokyo) Region and Adds Two New Voices Amazon Polly 資深產品經理 Robin Dautricourt

2017 年 9 月 29 日

Using Amazon Polly to Provide Real-Time Home Monitoring Alerts Y-Cam Solutions 資深開發人員 Siva K. Syamala
2017 年 8 月 30 日 How Amazon Polly Breathed Life into Dan Brown’s Digital Assistant Beeliked 執行長兼創辦人 Damian Dutton

這裡閱讀所有 Amazon Polly 相關的 AI 部落格文章。


自然的發音

自然的發音

Amazon Polly 提供數十種逼真的語音且支援多種語言,包括各種口音的多種男性和女性語音。Amazon Polly 多種語言的流暢發音,可讓您交付高品質的語音輸出,並建立全球使用者皆適用的應用程式。

輕鬆整合

輕鬆整合

Amazon Polly 讓您在網站、行動應用程式或裝置上新增語音變得輕鬆容易。使用 Amazon Polly,您只要將想要轉換為語音的文字寫入 Amazon Polly API,便可立即傳回音訊串流。不像其他解決方案需要冗長的核准程序,Amazon Polly 不需要您說明在應用程式中如何使用 Amazon Polly 的語音,也不需要簽署分發協議,所以您可以立即開始使用。

存放和轉散佈語音

存放和轉散佈語音

不像其他解決方案每次重播先前產生的音訊都需要支付權利金或收取費用,Amazon Polly 允許您無限次重播而不需要任何額外費用。離線使用也完全免費。您可以使用各種標準格式 (例如 MP3 和 OGG) 來建立語音檔案,並將這些檔案存放在裝置上 (例如行動電話或物聯網 (IoT) 裝置) 以供離線播放。

 

低成本

低成本

Amazon Polly 的按用量付費定價方式、低廉的字元轉換成本以及無限制重播,幾乎在所有應用程式啟用合成語音功能都是經濟實惠的方式。

快速回應

快速回應

交付逼真的語音和交談使用者體驗需要一致、快速的回應時間。啟用語音功能的應用程式需要無延遲地播放合成語音。試想提供導覽語音指示的應用程式、向學生提供有聲指導的線上學習應用程式,以及透過即時對話與使用者互動的應用程式。如果交談流程中的回應不會感覺到任何延遲的話,這些應用程式的效率會最好。即使您傳送冗長的文字到 Amazon Polly 的 API,它也會以串流方式將音訊傳回應用程式,所以您可以立即播放語音。這些種類的動態語音回應所需存取的語音音訊,通常比使用者裝置上能夠存放的量更大。Amazon Polly 位於雲端,所以您能夠存取各式各樣的合成語音。使用 Amazon Polly,您的應用程式不僅可包含即時資料,更可以提供更具價值的回應。

Amazon Polly 讓您在視訊、簡報或線上訓練課程新增語音變得輕鬆容易。Amazon Polly 可以產生 24 種語言的語音,讓您能夠輕易地在擁有全球用戶的應用程式中新增語音。您可以使用 Amazon Polly 來讀取 RSS 饋送、新聞或電子郵件,並且以音訊檔案格式來存放合成語音。

內容建立
GoAnimate

「Amazon Polly 讓 GoAnimate 使用者能夠使用我們的平台,立即為動畫中的角色提供語音。這在現場聲音受限於資源或時間的情況下尤其有用,例如在製作多種語言的影片或是預先製作以加速核准程序時。此語音功能與我們一組預先繪製動畫的豐富資產無縫地整合,更進一步強化了 GoAnimate 易於使用的特性,並為客戶提供效率和加快上市速度。」

– GoAnimate 執行長暨創辦人 Alvin Hung


Amazon Polly 可讓開發人員在應用程式提供增強的視覺體驗,例如語音同步臉部動畫或卡拉 OK 式字詞反白顯示。使用 Amazon Polly 可輕鬆請求額外的中繼資料串流,其中包含何時唸出特定句子、字詞和聲音的資訊。使用此中繼資料串流搭配合成語音音訊串流,客戶即可在虛擬人物說出文字時在應用程式產生動畫效果並反白顯示文字。

內容建立

「我們致力於使雲端教室對每個人都更具吸引力和有效性,包括閱讀和寫作障礙的使用者。藉由整合高品質的文字轉換語音功能和我們的 AppWriter 產品套件,Amazon Polly 強化了我們的學習平台。讓我們的使用者在應用程式唸出文字時即時看到反白顯示的文字是非常重要的。透過 Polly 的語音標記,AppWriter 可提供增強的閱讀體驗,為任何有閱讀和書寫困難的人創造一個真正公平的環境。」

– Wizkids 營運長 Stefan Pal


使用 Amazon Polly,您的客戶聯絡中心便能夠以自然發音的語音來提供回應。您可以透過互動式語音回應 (IVR) 系統來重播 Amazon Polly 的語音輸出。此外,您也可以利用 Amazon Polly 的 API 來提供自動化即時訊息,例如服務狀態、帳戶和帳單查詢、地址以及聯絡資訊。

客戶聯絡中心

「Bandwidth 建立了由 Amazon Polly 提供支援的小巧、可靠且快速的 TTS 應用程式。我們現在正以低成本使用高品質的語音。開發人員幾乎不費吹灰之力就建立了這個新服務。」

– Bandwidth 資深軟體開發人員 Yiannis Philipopoulos


Amazon Polly 讓新的物聯網 (IoT) 使用案例能夠以輕鬆且經濟實惠的方式在 IoT 裝置新增語音IoT 裝置可以使用語音提供自然的回應和通知、讓應用程式更易於存取,而且讓使用者不需倚賴螢幕畫面也能夠使用相關資訊。您可以使用 Amazon Polly 來產生語音檔案,並將檔案存放在裝置上供離線播放。

使用 AWS Lambda 根據 AWS IoT 規則引擎的事件產生預先簽署的 Polly URL,然後使用裝置閘道將這些 URL 傳送至您的 IoT 裝置,讓它們能夠要求逼真的語音。

物聯網 (IoT)

「我們的研究發現,現在的客戶如果覺得語音協助智慧型安全解決方案的聲音聽起來像機器人,就像市面上除了 AWS 服務以外的許多產品,他們的購買意願就會降低。我們的客戶非常喜歡 Amazon Polly 的人性化語音。事實上,很多人都覺得這就是真人在說話。」

– Y-Cam Solutions 執行長 Devin Chawda 


Amazon Polly 可以用來提升新語言教學應用程式的使用性。例如,最終使用者可以在應用程式輸入外語片語,然後聽該母語的人怎麼說這些片語。Amazon Polly 支援 24 種語言,提供老師和學生豐富的選項。

語言學習
Duolingo

「在學習新語言時,我想不出有什麼會比準確的發音更重要。我們發現在語言教學中,Amazon Polly 語音不僅僅是品質好而已,而是和真人說話一樣。」

– Duolingo 首席技術長 Severin Hacker


透過 Amazon Polly,您可以使用合成語音的形式為視障人士建立和散佈輔助資訊。以此方式協助視障人士使用各種內容,例如新聞、書籍或電子郵件訊息。

Royal National Institute of Blind People

「我們目前使用 Amazon 的語音文字轉換技術,以合成語音內容的形式為許多 B2B 和 B2C 客戶 (包括公共事業公司、金融機構和媒體公司) 及其他面向客戶的媒體 (例如雜誌和出版品) 建立和散佈輔助資訊。隨著 Amazon Polly 的發表,我們很高興能夠為這些客戶提供更好的體驗,藉由令人難以置信的逼真語音,深深吸引我們的觀眾。」

– Royal National Institute of Blind People 解決方案實作經理 John Worsfold

開始使用 Amazon Polly 非常簡單。登入主控台,按幾下滑鼠便可從您的文字開始產生語音。

開始使用