簡單易用的 API

Amazon Polly 提供 API,讓您可迅速將語音合成與您的應用程式整合。您只要將想要轉換為語音的文字傳送至 Amazon Polly API,Amazon Polly 就會立即將音訊串流傳回您的應用程式,應用程式便可開始直接串流,或是以標準音訊檔案格式存放,例如 MP3。

抽樣頻率 範本程式碼
"Hi. My name is Joanna." from boto3 import client
polly = client("polly", region_name="us-east-1")
response = polly.synthesize_speech(
        Text="Hi. My name is Joanna.",
        OutputFormat="mp3",
        VoiceId="Joanna")

眾多語音與語言選擇

Amazon Polly 包含了數十種逼真的語音且支援多種語言,因此您可以選取適當的語音,然後在多個國家分發啟用語音功能的應用程式。

語言 女性
男性
澳洲英文 Nicole Russell
巴西葡萄牙文 Vitória Ricardo
加拿大法文 Chantal  
丹麥文 Naja Mads
荷蘭文 Lotte Ruben
法文

Léa

Céline

Mathieu

 

德文 Vicki Hans
  Marlene  
冰島文 Dóra Karl
印度英文

Raveena

Aditi

 
義大利文 Carla Giorgio
日文 Mizuki Takumi
韓文 Seoyeon  
挪威文 Liv  
波蘭文 Ewa Jacek
  Maja Jan
葡萄牙文 – 伊比利半島 Inês Cristiano
羅馬尼亞文 Carmen  
俄文 Tatyana Maxim
西班牙文 – 標準 Conchita Enrique
瑞典文 Astrid  
土耳其文 Filiz  
英國英文 Amy Brian
  Emma  
美國英文 Joanna Matthew
  Salli Justin
  Kendra Joey
  Kimberly  
  Ivy  
美國西班牙文 Penélope Miguel
威爾斯文 Gwyneth  
威爾斯英文   Geraint

同步語音以增強視覺體驗

使用 Amazon Polly 可輕鬆請求額外的中繼資料串流,其中包含何時唸出特定句子、字詞和聲音的資訊。使用此中繼資料串流搭配合成語音音訊串流,您現在可以建立擁有增強視覺體驗的應用程式,例如語音同步臉部動畫或卡拉 OK 式字詞反白顯示。

請瀏覽文件以進一步了解如何使用語音標記。

優化您的串流音訊

使用 Amazon Polly,您可以透過應用程式以近乎即時的速度將各種資訊串流給使用者。您有多種抽樣頻率可選擇,讓您針對應用程式優化頻寬與音訊品質。Amazon Polly 支援 MP3、Vorbis 和原始 PCM 音訊串流格式。

抽樣頻率 MP3 大小   OGG 大小
PCM 大小
22.05 kHz 聆聽
19.02 kB 19.14 kB
16.05 kHz 聆聽 16.04 kB
16.35 kB
99.53 kB
8.00 kHz 聆聽 13.26 kB 10.40 kB 49.76 kB

調整語音速度、聲調與音量

Amazon Polly 支援語音合成標記語言 (SSML),這是一種適用於語音合成應用程式的 XML 型標記語言,採用 W3C 標準,且支援語調、重音與音調的常見 SSML 標籤。這些調整彈性可讓您製作逼真的語音,持續引起聽眾的注意力。

要進一步了解,請瀏覽 Amazon Polly 文件上的 SSML 標籤

範本 SSML
This is how I speak normally. (無)
I can speak in a higher pitched voice, or I can speak in a lower pitched voice. I can speak in a higher pitched voice , or I can speak in a lower pitched voice
I can speak really slowly, or I can speak really fast. I can speak really slowly , or  I can speak really fast
I can also speak very loudly, or I can speak very quietly. I can also speak very loudly , or I can speak very quietly .
I can whisper. I have a secret to tell you, I will whisper it to you. ' I am not human. Can you believe it?

調整語音的最長持續時間

Amazon Polly 可以讓您根據「時間驅動韻律」功能所定義的最大分配時間來自動調整語音速度。這對許多使用案例都有好處,特別是在本地化方面。

例如,假設您在訓練影片中嵌入美式英文發音,然後希望將這段影片本地化為德文。假設您使用 Amazon Translate 翻譯文字,並用 Polly 進行配音。串流時讓本地化德文配音對應到影片的每個畫面非常重要,因此德文配音不能比美式英文配音還長。您可以使用這個功能,更輕鬆地完成配音過程。

平台與程式語言支援

Amazon Polly 支援 AWS 開發套件 (Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++) 與 AWS Mobile SDK (iOS/Android) 中的所有程式設計語言。此外,Polly 也支援 HTTP API,方便您自行實作存取層。

透過 API、主控台或命令列存取的語音合成

Amazon Polly 可以透過 Polly API (和各種語言特定的開發套件)、AWS 管理主控台及 AWS 命令列界面 (CLI) 來存取。無論透過主控台、API 或 CLI 使用服務,您都可以完整控制 Amazon Polly 的所有功能。

自訂語彙

透過 Amazon Polly 的自訂語彙或字彙,您可以修改特定字詞的發音,例如公司名稱、縮寫、外文字詞與新詞 (例如,以法文以外的語音說出 "ROTFL"、"C'est la vie")。若要自訂這些發音,您可以上傳含有語彙項目的 XML 檔案。舉例來說,使用以下 XML 檔案提供音素即可自訂 Nguyen 的發音:


            Nguyen
            nguyen
            NGUYEN
            "nu.jEn'

進一步了解 Amazon Polly 定價

瀏覽定價頁面
準備好開始使用了嗎?
註冊
還有其他問題嗎?
聯絡我們