Prova Amazon Polly

Registrati per creare un account gratuito
Oppure accedi alla console

Il piano gratuito di Amazon Polly prevede 5 milioni di caratteri al mese per i primi 12 mesi a partire dalla prima richiesta di discorso.

Visualizza i dettagli del piano gratuito di AWS »


D: Cos'è Amazon Polly?

Amazon Polly è un servizio che trasforma il testo in voce naturale. Amazon Polly consente alle applicazioni esistenti di dotarsi di una funzionalità di sintesi vocale in piena regola e apre la via a categorie completamente nuove di prodotti con funzionalità vocali, ad esempio applicazioni per cellulari, automobili, dispositivi ed elettrodomestici. Amazon Polly include decine di voci naturali e supporta diverse lingue, permettendoti di selezionare la voce ideale e distribuire le tue applicazioni con risposte vocali in diverse aree geografiche. Amazon Polly è facile da usare: basta inviare alla relativa API il testo da convertire in voce e Amazon Polly restituirà immediatamente un flusso audio da riprodurre direttamente o da memorizzare in formato audio standard, ad esempio MP3. Amazon Polly supporta i tag dello Speech Synthesis Markup Language (SSML), ad esempio "prosody", che consentono di adeguare la velocità, il tono o il volume della voce generata. Amazon Polly è un servizio sicuro che fornisce tutti questi vantaggi su larga scala e a bassa latenza. I file vocali generati possono essere memorizzati nella cache e riprodotti nuovamente in Amazon Polly senza alcun costo aggiuntivo. Polly permette di convertire 5 milioni di caratteri al mese gratuitamente per un anno dalla data di registrazione. Le tariffe basate sul consumo effettivo, il costo contenuto per richiesta e l'assenza di limitazioni di storage e di riutilizzo dell'output vocale, fanno di Amazon Polly un modo economico per abilitare la sintesi vocale in qualsiasi contesto.

D: Qual è il vantaggio di utilizzare Amazon Polly?

Amazon Polly può essere utilizzato per potenziare l’applicazione con output vocali di alta qualità. Questo conveniente servizio offre tempi di risposta molto ridotti ed è disponibile per praticamente qualsiasi caso d’uso, senza limitazioni di storage e riutilizzo della voce generata.

D: Quali caratteristiche sono disponibili?

È possibile controllare vari aspetti della sintesi vocale come la pronuncia, il volume, il tono, la velocità e così via, utilizzando lo Speech Synthesis Markup Language (SSML) standardizzato. Sarà possibile rilevare quali specifiche parole o frasi nel testo vengono pronunciate all'utente in base ai metadati inclusi nel flusso audio. In questo modo lo sviluppatore può sincronizzare l'evidenziazione grafica e le animazioni, ad esempio le labbra di un avatar virtuale, con l'audio. Con i dizionari personalizzati, puoi modificare la pronuncia di singole parole, ad esempio nomi prodotto, acronimi, prestiti da altre lingue e neologismi (ad esempio "P!nk", "ROTFL" oppure "C'est la vie" in lingue diverse dal francese).

D: Cosa sono i contrassegni vocali?

I contrassegni vocali sono un elemento studiato per dotare di ulteriori funzionalità la sintesi vocale. Utilizzando dei metadati associati al flusso audio di sintesi vocale, i clienti potranno offrire un'esperienza visiva perfettamente coerente e sincronizzata all'audio tramite animazioni o evidenziazioni di blocchi di testo come nei karaoke.

Amazon Polly genera contrassegni vocali tramite quattro elementi:

1) Frase, che indica l'elemento frase corrispondente al testo da leggere.

2) Parola, che indica l'elemento parola nel testo.

3) Visema, che indica la forma delle labbra corrispondente ai suoni pronunciati.

4) SSML, che descrive un elemento SSML utilizzato nel testo.

I contrassegni vocali sono attivati in forma di flusso JSON (nello specifico come insieme di oggetti JSON autonomi delimitati da nuove righe), che contiene da uno a tutti e quattro gli elementi elencati, solo quando il metodo synthesize-speech viene utilizzato con il parametro speech-mark-types. Per ulteriori informazioni, consulta il documento Amazon Polly Developer Guide.

D: Quali sono i casi d'uso più comuni per questo servizio?

Amazon Polly permette di rendere vive le tua applicazioni grazie all'aggiunta di funzionalità vocali realistiche. Ad esempio, nel campo dell’istruzione e dell’e-learning, si possono creare applicazioni sfruttando la funzionalità di sintesi vocale (TTS) di Amazon Polly per aiutare le persone con disabilità di lettura. Amazon Polly può essere utilizzato per aiutare non vedenti e ipovedenti a utilizzare i contenuti digitali (eBook, notizie e così via). Amazon Polly può essere utilizzato nei sistemi di annuncio per il trasporto pubblico e nei sistemi di controllo industriale per notifiche e annunci di emergenza. Amazon Polly può essere sfruttato da un’ampia gamma di dispositivi quali set-top box, smartwatch, tablet, smartphone e dispositivi IoT, per fornire output audio. Amazon Polly può essere utilizzato nelle soluzioni di telefonia per dare voce ai sistemi di risposta vocale interattiva. Le applicazioni come giochi a quiz, animazioni, avatar o produzione di narrazione sono casi d’uso comuni per soluzioni TTS basate sul cloud come Amazon Polly.

D: Come funziona questo prodotto con altri prodotti AWS?

Quando viene integrato con Amazon Lex, gli sviluppatori possono creare vere e proprie interfacce utente vocali per le loro applicazioni. Con Amazon Connect, le funzioni vocali di Amazon Polly sono utilizzate per creare servizi di contact center self-service basati sul cloud. In aggiunta, gli sviluppatori di applicazioni mobili e di soluzioni per l'internet delle cose (IoT) possono sfruttare Amazon Polly per aggiungere output vocali ai propri sistemi.

D: Quali sono i vantaggi di una soluzione di sintesi vocale basata su cloud rispetto a una su dispositivo?

Le soluzioni di sintesi vocale su dispositivo richiedono risorse informatiche importanti per renderle disponibili sul dispositivo, specialmente in termini di potenza della CPU, RAM e spazio su disco. Questo può comportare costi di sviluppo e consumi energetici maggiori su dispositivi come tablet, smartphone, ecc. Al contrario, la conversione da testo a voce su cloud riduce drasticamente i requisiti locali in termini di risorse. Questo permette di supportare tutte le lingue e le voci disponibili con la massima qualità possibile. Inoltre, correzioni e miglioramenti dell’espressione vocale sono immediatamente disponibili per tutti gli utenti finali e non necessitano di ulteriori aggiornamenti per tutti i dispositivi. La sintesi vocale (TTS) su cloud è indipendente dalla piattaforma, quindi riduce al minimo il tempo e l’impegno di sviluppo.

D: Come si inizia a usare Amazon Polly?

Semplicemente eseguendo l’accesso al tuo account AWS e accedendo alla console di Amazon Polly, che fa parte della console AWS. Da quel momento la console può essere utilizzata per digitare un qualsiasi testo e ascoltare la voce generata o salvarla come file audio.

D: In quali regioni è disponibile il servizio?

Amazon Polly è accessibile in tutto il mondo dalle 14 seguenti regioni AWS: Asia Pacifico (Mumbai), Asia Pacifico (Seoul), Asia Pacifico (Singapore), Asia Pacifico (Sydney), Asia Pacifico (Tokyo), Canada (Centrale), UE (Francoforte), UE (Irlanda), UE (Londra), Sud America (San Paolo), Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio), Stati Uniti occidentali (California settentrionale) e Stati Uniti occidentali (Oregon).

D: Quali linguaggi di programmazione supporta?

Amazon Polly supporta tutti i linguaggi di programmazione inclusi nell’SDK AWS quali, Java, Node.js, .NET, PHP, Python, Ruby, Go, e C++, e nell’SDK AWS Mobile come iOS/Android. Amazon Polly supporta inoltre l'API HTTP per poter implementare un layer di accesso personalizzato.

D: Quali formati audio supporta?

Con Amazon Polly è possibile eseguire lo streaming dell’audio ai tuoi utenti quasi in tempo reale. Inoltre potrai scegliere tra diverse frequenze di campionamento per ottimizzare la banda di rete e la qualità audio per l’applicazione. Amazon Polly supporta i formati di streaming audio MP3, Vorbis e PCM grezzo.

D: Quali lingue supporta?

Inglese (Stati Uniti) Olandese Coreano Spagnolo (Stati Uniti)
Inglese (Australia) Francese Polacco Svedese
Inglese (Gran Bretagna) Francese (Canada)
Portoghese Turco
Inglese (India) Tedesco Portoghese (Brasile)
Norvegese
Inglese (Galles) Islandese Rumeno  
Gallese Italiano Russo
  
Danese Giapponese Spagnolo (Spagna)
 

D: Amazon Polly prevede qualche limitazione?

Per garantire la massima disponibilità delle risorse AWS e ridurre al minimo i rischi di spese eccessive per i nuovi clienti, AWS ha stabilito alcune limitazioni al servizio per ciascun account. Quando si usa Amazon Polly con un'applicazione che fornisce output vocale di alta qualità, sono presenti alcune limitazioni di servizio su throttling, funzionamento e uso Speech Synthesis Markup Language (SSML). Per ulteriori informazioni, consulta la sezione Limits of Amazon Polly nella Developer Guide. L'uso di Amazon Polly con altri servizi AWS, ad esempio AWS Batch per l'elaborazione in batch, può risultare molto utile per sfruttare tutte le possibilità offerte da Amazon Polly senza incorrere in limitazioni del servizio.


D: Quanto costa Amazon Polly?

Consulta la pagina dei prezzi di Amazon Polly per informazioni aggiornate.

D: È possibile utilizzare il servizio per generare istruzioni vocali statiche che verranno riprodotte più volte?

Sì. Il servizio non impone limitazioni al riguardo e non viene addebitato alcun costo aggiuntivo per questo tipo di utilizzo.

D: È possibile utilizzare il servizio per generare contenuti che verranno utilizzati in sistemi di notifica di massa, ad esempio nelle stazioni ferroviarie?

Sì. Il servizio non impone limitazioni al riguardo e non viene addebitato alcun costo aggiuntivo per questo tipo di utilizzo.

D: Se una richiesta prevede la sintesi vocale di 1.000 caratteri e l'applicazione di contrassegni vocali per gli stessi 1.000 caratteri, la fatturazione sarà calcolata su 2.000 caratteri totali?

Sì. Sarà addebitata ogni richiesta di sintesi vocale o di contrassegno vocale in base al numero di caratteri inviati al servizio.

D: Amazon Polly partecipa al piano gratuito di AWS?

Sì, poiché hai accesso al piano di utilizzo gratuito di AWS, puoi iniziare a utilizzare Amazon Polly gratuitamente. Dopo l'iscrizione, i nuovi clienti Amazon Polly possono sintetizzare fino a 5 milioni di caratteri al mese gratuitamente per i primi 12 mesi.

D: I prezzi includono le tasse?

Per maggiori dettagli sulle tasse, consulta l'Assistenza di Amazon Web Services sulle imposte.


D: È previsto l’utilizzo da parte di Amazon Polly dei miei contenuti per migliorare il servizio? Cosa prevede l'informativa sulla privacy per Amazon Polly?

Amazon Polly può utilizzare i contenuti degli utenti per migliorare la qualità dei servizi e di altri prodotti e servizi con funzionalità di apprendimento automatico offerti da AWS e dalle società consociate. La possibilità di utilizzare almeno in parte i tuoi contenuti è fondamentale per l'ulteriore sviluppo della tecnologia sottostante e per il miglioramento dell'esperienza dei clienti di Amazon Polly. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli scrupolosi e sofisticati, sia tecnici sia fisici, progettati per impedire accessi non autorizzati e divulgazione di dati riservati e garantire che l'utilizzo dei contenuti da parte nostra sia conforme agli impegni presi nei tuoi confronti. Per ulteriori informazioni, consulta le domande frequenti sulla Privacy dei dati AWS.