Amazon Polly è un servizio che trasforma il testo in una conversazione reale. Amazon Polly include decine di voci naturali e supporta diverse lingue, per permettere di selezionare la voce più adatta e distribuire le proprie applicazioni con risposte vocali in diversi paesi. Con Amazon Polly, è sufficiente inviare alla relativa API il testo da convertire in voce e Amazon Polly restituirà immediatamente all'applicazione un flusso audio da riprodurre direttamente o da memorizzare in formato audio standard, ad esempio MP3.
Prova Amazon Polly
Registrati per creare un account gratuitoOppure accedi alla console
Il piano gratuito di Amazon Polly prevede 5 milioni di caratteri al mese per i primi 12 mesi a partire dalla prima richiesta di discorso.
Amazon Polly fornisce un'API che permette di integrare rapidamente la sintesi vocale in un'applicazione. È sufficiente inviare alla relativa API il testo da convertire in voce e Amazon Polly restituirà immediatamente all'applicazione un flusso audio da riprodurre direttamente o da memorizzare in formato audio standard, ad esempio MP3.
| Velocità di campionamento | Codice di esempio |
| "Hi. My name is Joanna." | from boto3 import client polly = client("polly", region_name="us-east-1") response = polly.synthesize_speech( Text="Hi. My name is Joanna.", OutputFormat="mp3", VoiceId="Joanna") |
Amazon Polly include decine di voci naturali e supporta diverse lingue, per permettere di selezionare la voce più adatta e distribuire le proprie applicazioni con risposte vocali in diversi paesi.
| Lingua | Femminile |
Maschile |
| Inglese australiano | Nicole | Russell |
| Portoghese (Brasile) | Vitória | Ricardo |
| Francese (Canada) | Chantal | |
| Danese | Naja | Mads |
| Olandese | Lotte | Ruben |
| Francese | Céline | Mathieu |
| Tedesco | Vicki | Hans |
| Marlene | ||
| Icelandic | Dóra | Karl |
| Inglese (India) | Raveena | |
| Italiano | Carla | Giorgio |
| Giapponese | Mizuki | |
| Norvegese | Liv | |
| Polacco | Ewa | Jacek |
| Maja | Jan | |
| Portoghese (Portogallo) | Inês | Cristiano |
| Rumeno | Carmen | |
| Russo | Tatyana | Maxim |
| Spagnolo (castigliano) | Conchita | Enrique |
| Svedese | Astrid | |
| Turco | Filiz | |
| Inglese (GB) | Amy | Brian |
| Emma | ||
| Inglese (USA) | Joanna | Joey |
| Salli | Justin | |
| Kendra | ||
| Kimberly | ||
| Ivy | ||
| Spagnolo (USA) | Penélope | Miguel |
| Gallese | Gwyneth | |
| Inglese (Galles) | Geraint |
Con Amazon Polly, è semplice ottenere flussi di metadati aggiuntivi relativi alle informazioni sulla posizione di frasi, parole e suoni pronunciati specifici. Utilizzando questi metadati insieme al flusso audio di sintesi vocali, è possibile creare applicazioni con funzionalità di visualizzazione avanzate, ad esempio visi animati sincronizzati con il parlato o blocchi di parole evidenziati come nei karaoke.
Consulta la documentazione per ulteriori informazioni su come utilizzare i contrassegni vocali.
Con Amazon Polly, puoi trasmettere in streaming agli utenti tutte le informazioni che desideri tramite l'applicazione in tempo reale. Puoi anche scegliere tra diversi livelli frequenza di campionamento per ottimizzare la larghezza di banda utilizzata e la qualità audio. Amazon Polly supporta lo streaming di formati audio MP3, Vorbis e PCM raw.
Amazon Polly supporta lo Speech Synthesis Markup Language (SSML), un linguaggio di markup W3C standard basata su XML per la sintesi vocale, nonché i tag SSML che permettono di variare progressione, enfasi e intonazione. Grazie a questo livello di flessibilità, è possibile creare voci estremamente verosimili in grado di attirare e mantenere l'attenzione degli utenti.
Per ulteriori informazioni, consulta la documentazione su Amazon Polly in relazione ai tag SSML.
| Campionamento | SSML |
| This is how I speak normally. | (nessuno) |
| I can speak in a higher pitched voice, or I can speak in a lower pitched voice. |
|
| I can speak really slowly, or I can speak really fast. |
|
| I can also speak very loudly, or I can speak very quietly. |
|
| I can whisper. |
|
Amazon Polly supporta tutti i linguaggi di programmazione inclusi nel kit SDK AWS (Java, Node.js, .NET, PHP, Python, Ruby, Go e C++) e nel kit SDK AWS Mobile (iOS/Android). Polly offre inoltre un'API HTTP con cui implementare un proprio layer di accesso.
È possibile accedere ad Amazon Polly tramite API (e diversi kit SDK specifici della lingua in uso), Console di gestione AWS e interfaccia a riga di comando (CLI) di AWS. Amazon Polly mette a disposizione il controllo di tutte le sue funzionalità, sia con la console sia con le API o con l'interfaccia a riga di comando.
Con i dizionari personalizzati di Amazon Polly, puoi modificare la pronuncia di singole parole, ad esempio nomi prodotto, acronimi, prestiti da altre lingue e neologismi (ad esempio "ROTFL" oppure "C'est la vie" in lingue diverse dal francese). Per personalizzare queste pronunce, è sufficiente caricare un file XML con le voci lessicali. Ad esempio, per personalizzare la pronuncia di Nguyen puoi i fonemi corretti utilizzando il seguente file XML: