API semplice da utilizzare

Amazon Polly fornisce un'API che permette di integrare rapidamente la sintesi vocale in un'applicazione. È sufficiente inviare alla relativa API il testo da convertire in voce e Amazon Polly restituirà immediatamente all'applicazione un flusso audio da riprodurre direttamente o da memorizzare in formato audio standard, ad esempio MP3.

Velocità di campionamento Codice di esempio
"Hi. My name is Joanna." from boto3 import client
polly = client("polly", region_name="us-east-1")
response = polly.synthesize_speech(
        Text="Hi. My name is Joanna.",
        OutputFormat="mp3",
        VoiceId="Joanna")

Ampia selezione di voci e lingue

Amazon Polly include decine di voci naturali e supporta diverse lingue, per permettere di selezionare la voce più adatta e distribuire le proprie applicazioni con risposte vocali in diversi paesi.

Linguaggio Femmina
Maschio
Inglese australiano Nicole Russell
Portoghese brasiliano Vitória Ricardo
Francese (Canada) Chantal  
Danese Naja Mads
Olandese Lotte Ruben
Francese

Léa

Céline

Mathieu

 

Tedesco Vicki Hans
  Marlene  
Hindi Aditi
 
Islandese Dóra Karl
Inglese (India)

Raveena

Aditi

 
Italiano Carla Giorgio
Giapponese Mizuki Takumi
Coreano Seoyeon  
Cinese mandarino Zhiyu  
Norvegese Liv  
Polacco Ewa Jacek
  Maja Jan
Portoghese (Portogallo) Inês Cristiano
Rumeno Carmen  
Russo Tatyana Maxim
Spagnolo (castigliano) Conchita Enrique
Svedese Astrid  
Turco Filiz  
Inglese (GB) Amy Brian
  Emma  
Inglese (USA) Joanna Matthew
  Salli Justin
  Kendra Joey
  Kimberly  
  Ivy  
Spagnolo (USA) Penélope Miguel
Gallese Gwyneth  
Inglese (Galles)   Geraint

Voce sincronizzata a funzionalità di visualizzazione

Con Amazon Polly, è semplice ottenere flussi di metadati aggiuntivi relativi alle informazioni sulla posizione di frasi, parole e suoni pronunciati specifici. Utilizzando questi metadati insieme al flusso audio di sintesi vocale, è possibile creare applicazioni con funzionalità di visualizzazione avanzate, ad esempio visi animati sincronizzati con il parlato o blocchi di parole evidenziati come nei karaoke.

Consulta la documentazione per ulteriori informazioni su come utilizzare i contrassegni vocali. 

Ottimizzazione del flusso audio

Con Amazon Polly, puoi trasmettere in streaming agli utenti tutte le informazioni che desideri tramite l'applicazione in tempo reale. Puoi anche scegliere tra diversi livelli frequenza di campionamento per ottimizzare la larghezza di banda utilizzata e la qualità audio. Amazon Polly supporta lo streaming di formati audio MP3, Vorbis e PCM raw.

Velocità di campionamento Dimensioni MP3  Dimensioni OGG
Dimensioni PCM
22,05 kHz Ascolta
19,02 KB 19,14 KB N/D
16,05 kHz Ascolta 16,04 KB
16,35 KB
99,53 KB
8,00 kHz Ascolta 13,26 KB 10,40 KB 49,76 KB

Ottimizzazione di velocità, tonalità e volume

Amazon Polly supporta lo Speech Synthesis Markup Language (SSML), un linguaggio di markup W3C standard basata su XML per la sintesi vocale, nonché i tag SSML che permettono di variare progressione, enfasi e intonazione. Grazie a questo livello di flessibilità, è possibile creare voci estremamente verosimili in grado di attirare e mantenere l'attenzione degli utenti.

Per ulteriori informazioni, consulta la documentazione su Amazon Polly in relazione ai tag SSML.

Esempio SSML
Così è come parlo normalmente. (nessuno)
Posso parlare con una voce più acuta o posso parlare con una voce più bassa. <speak>I can speak in a <prosody pitch="high">higher pitched voice</prosody>, or I can speak <prosody pitch="low">in a lower pitched voice</prosody></speak>
Posso parlare molto lentamente o posso parlare molto velocemente. <speak>I can speak <prosody rate="x-slow">really slowly</prosody>, or  I can speak <prosody rate="x-fast">really fast</prosody></speak>
Posso anche parlare molto forte o posso parlare molto tranquillamente. <speak>Posso anche parlare <prosody volume="x-loud">molto forte</prosody> o posso parlare <prosody volume="x-soft">molto tranquillamente</prosody>. </speak>
Posso sussurrare. <speak>Ho un segreto da dirti, te lo sussurrerò.<amazon:effect name="whispered">'<prosody rate="x-slow"> <prosody volume="loud">Non sono una persona.</prosody></prosody></amazon:effect>Ci credi?</speak>

Regolazione della durata

Amazon Polly permette di regolare automaticamente la velocità della voce generata in base all'intervallo di tempo massimo assegnato, tramite una funzione denominata prosodia temporizzata. Si tratta di una caratteristica utile in diversi casi d'uso, in particolare per la localizzazione.

Ad esempio, supponiamo di avere un video di training in inglese che desideriamo localizzare in tedesco. Poniamo che sia stato utilizzato Amazon Translate per tradurre il testo e Polly per dare voce alla traduzione. È essenziale che alla voce localizzata in tedesco corrispondano le stesse immagini dell'inglese nel video, perciò l'audio tedesco non può essere più lungo di quello inglese. Questa funzionalità facilita il processo di ridoppiaggio.

Supporto per piattaforme e linguaggi di programmazione

Amazon Polly supporta tutti i linguaggi di programmazione inclusi nel kit SDK AWS (Java, Node.js, .NET, PHP, Python, Ruby, Go e C++) e nel kit SDK AWS Mobile (iOS/Android). Polly offre inoltre un'API HTTP con cui implementare un proprio layer di accesso.

Sintesi vocale tramite API, console e riga di comando

È possibile accedere ad Amazon Polly tramite API (e diversi kit SDK specifici della lingua in uso), Console di gestione AWS e interfaccia a riga di comando (CLI) di AWS. Amazon Polly mette a disposizione il controllo di tutte le sue funzionalità, sia con la console sia con le API o con l'interfaccia a riga di comando.

Dizionari personalizzati

Con i dizionari personalizzati di Amazon Polly, puoi modificare la pronuncia di singole parole, ad esempio nomi prodotto, acronimi, prestiti da altre lingue e neologismi (ad esempio "ROTFL" oppure "C'est la vie" in lingue diverse dal francese). Per personalizzare queste pronunce, è sufficiente caricare un file XML con le voci lessicali. Ad esempio, per personalizzare la pronuncia di Nguyen puoi i fonemi corretti utilizzando il seguente file XML:

<lexeme>
            <grapheme>Nguyen</grapheme>
            <grapheme>nguyen</grapheme>
            <grapheme>NGUYEN</grapheme>
            <phoneme>"nu.jEn'</phoneme>
</lexeme>

Ulteriori informazioni sui prezzi di Amazon Polly

Visita la pagina dei prezzi
Sei pronto per iniziare?
Registrati
Hai altre domande?
Contattaci