Nozioni di base su Amazon Polly

Amazon Polly è un servizio che trasforma il testo in una conversazione reale. Amazon Polly permette di creare applicazioni che parlano, sviluppando categorie completamente nuove di prodotti con funzionalità vocali. Amazon Polly è un servizio Amazon AI che utilizza tecnologie avanzate di apprendimento approfondito per sintetizzare una voce che assomiglia a quella umana. Polly include decine tipi di voce naturale e supporta diverse lingue per permettere di selezionare la voce più adatta e distribuire le proprie applicazioni con risposte vocali in diversi mercati.

Amazon Polly offre i tempi di risposta rapidi e costanti necessari per supportare dialoghi interattivi in tempo reale. La sintesi vocale di Amazon Polly può essere memorizzata nella cache e salvata per essere riprodotta offline o ridistribuita. Amazon Polly, inoltre, è facile da usare. È sufficiente inviare alla relativa API il testo da convertire in voce e Amazon Polly restituirà immediatamente all'applicazione un flusso audio da riprodurre direttamente o da memorizzare in formato audio standard, ad esempio MP3.

Con Amazon Polly paghi solo per il numero di caratteri convertiti in voce; l'audio generato da Amazon Polly può essere salvato e riprodotto nuovamente. Il costo contenuto per carattere convertito e l'assenza di restrizioni a storage e riutilizzo dell'output vocale fanno di Polly un servizio estremamente conveniente per applicare la sintesi vocale in varie applicazioni.

Ascolta Amazon Polly

Per visualizzare i video su questo sito, è necessario Adobe Flash Player o un browser moderno.

Introduzione ad Amazon Polly
1:20
Introduzione ad Amazon Polly: AWS re:Invent 2016


Annunciati contrassegni vocali e voci sussurrate

Panoramica di 2 minuti sulle nuove caratteristiche di Amazon Polly: contrassegni vocali e voci sussurrate (aprile 2017)


Lingua Donna Uomo Testo di esempio
Inglese Joanna Joey Hello. Do you speak a foreign language? One language is never enough.
Danese Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Portoghese brasiliano Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Spagnolo Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Icelandic Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.

Consulta l'elenco completo delle voci e delle lingue supportate di Amazon Polly qui.

Voci dal suono naturale

Voci dal suono naturale

Amazon Polly fornisce decine tipi di voce naturale e supporta diverse lingue, fra cui un'ampia gamma di voci maschili e femminili con diversi accenti. La pronuncia scorrevole del testo di Amazon Polly in più lingue consente di distribuire output vocali di alta qualità e di creare applicazioni per utenti di tutto il mondo.

Facile integrazione

Facile integrazione

Amazon Polly ti consente di aggiungere facilmente la sintesi vocale a siti Web, app per dispositivi mobili o dispositivi. Con Polly, è sufficiente scrivere il testo da convertire in voce nell'API di Amazon Polly; il servizio restituirà immediatamente il flusso vocale. Diversamente da altre soluzioni che richiedono lunghe procedure di approvazione, Amazon Polly non richiede una descrizione del futuro utilizzo della sintesi vocale nella specifica applicazione, né contratti da firmare, perciò puoi iniziare a utilizzare il servizio da subito.

Memorizza e ridistribuisci testo parlato

Memorizza e ridistribuisci testo parlato

Diversamente da altre soluzioni che richiedono il pagamento di diritti d'autore o ti addebitano un costo ogni volta che riproduci dell'audio generato in precedenza, Amazon Polly ti permette di riprodurlo in modo illimitato senza costi aggiuntivi. La riproduzione gratuita si estende anche all'utilizzo offline. Puoi creare file audio in numerosi formati standard, come MP3 e OGG, e memorizzarli su dispositivi come telefoni cellulari o dispositivi Internet of Things (IoT) per la riproduzione offline.

 

Costi ridotti

Costi ridotti

I prezzi basati sull'utilizzo effettivo, il basso costo per carattere convertito e la riproduzione illimitata fanno di Polly un modo efficiente per aggiungere la sintesi vocale a praticamente qualsiasi applicazione.

Risposta rapida

Risposta rapida

La distribuzione di voci naturali e di esperienze utente di conversazione necessitano tempi di risposta rapidi e costanti. Le applicazioni abilitate alla funzionalità vocale devono riprodurre la sintesi vocale immediatamente. Prendi per esempio le applicazioni che forniscono indicazioni stradali, le applicazioni di eLearning che forniscono istruzioni verbali agli studenti e le applicazioni che coinvolgono l'utente mediante un dialogo in tempo reale. Queste applicazioni sono più efficaci quando le risposte iniziano senza interruzioni percepibili nel flusso della conversazione. Anche quando vengono inoltrati all'API di Amazon Polly testi di considerevole lunghezza, l'audio viene restituito direttamente all'applicazione sotto forma di flusso, perciò la voce potrà essere riprodotta immediatamente. Questi tipi di risposte parlate dinamiche richiedono accesso a una quantità di audio molto maggiore di quella di solito disponibile in memoria nei dispositivi degli utenti. Amazon Polly è nel cloud, perciò hai accesso a un'ampia scelta di sintesi vocale. Con Amazon Polly, la tua applicazione può fornire risposte di qualità che includono dati in tempo reale.

Amazon Polly semplifica l'aggiunta della voce a video, presentazioni o corsi di formazione online. Amazon Polly può generare sintesi vocale in 24 lingue, semplificando l'aggiunta di voce ad applicazioni per un pubblico globale. Con Amazon Polly è possibile leggere feed RSS, notizie o e-mail e memorizzare l'output vocale in file audio.

Creazione di contenuti
GoAnimate

"Amazon Polly fornisce agli utenti di GoAnimate la possibilità di dare voce ai personaggi animati utilizzando la nostra piattaforma. Questo è particolarmente utile in casi nei quali la voce fuori campo live è impossibile in termini di risorse o di tempo, per esempio quando si sviluppa un video in più lingue o in caso di preproduzione per accelerare il processo di approvazione. La voce viene integrata in modo perfetto grazie alla ricca scelta di asset preanimati che proponiamo; questo aumenta la facilità d'uso di GoAnimate e garantisce ai nostri clienti efficienza e tempi più rapidi di introduzione sul mercato."

– Alvin Hung, amministratore delegato e fondatore, GoAnimate


Amazon Polly consente agli sviluppatori di integrare nelle applicazioni funzionalità di visualizzazione quali la sincronizzazione tra voce e viso o l'evidenziazione dei blocchi di testo come nei karaoke. Con Amazon Polly, è semplice ottenere flussi di metadati aggiuntivi relativi alle informazioni sulla posizione di frasi, parole e suoni pronunciati specifici. Utilizzando questi metadati insieme al flusso audio di sintesi vocale, i clienti possono animare gli avatar ed evidenziare il testo in perfetta sincronia con la voce.

Creazione di contenuti
Wizkids

"Facciamo di tutto per rendere i corsi gestiti nel cloud più coinvolgenti ed efficaci per tutti, compresi gli utenti con disabilità di lettura e scrittura. Amazon Polly migliora la nostra piattaforma di apprendimento perché consente l'aggiunta di sintesi vocale di alta qualità nella nostra suite di prodotti AppWriter. È essenziale per i nostri utenti vedere in tempo reale le parole che corrispondono ai suoni pronunciati dalla voce. Grazie ai contrassegni di Polly, AppWriter è in grado di fornire un'esperienza di lettura di alta qualità che facilita l'apprendimento di chi ha problemi di lettura e scrittura."

– Stefan Pal, direttore operativo, Wizkids

Amazon Polly permette di aggiungere facilmente la sintesi vocale ad applicazioni e giochi per dispositivi mobili. Con Amazon Polly, puoi memorizzare risposte vocali standard sul dispositivo, consentendo anche risposte dinamiche in tempo reale, ad esempio dialoghi tra personaggi in un gioco, punteggi in una classifica e inviti a giochi.

Applicazioni per dispositivi mobili e desktop
Washington Post

“Da tempo eravamo interessati a mettere a disposizione la versione audio delle oltre 1.200 storie quotidiane, ma le soluzioni di sintesi vocale esistenti non offrivano una buona resa rispetto alla qualità del parlato prodotta. Con l'arrivo di Amazon Polly e delle sue voci di alta qualità vogliamo offrire ai lettori modalità più ricche e versatili per fruire dei nostri contenuti.”

- Joseph Price, Senior Product Manager, The Washington Post


Con Amazon Polly, i contact center clienti possono rispondere con voci dal suono naturale. L'output vocale può essere riprodotto tramite i sistemi di risposta vocale interattiva (IVR). Inoltre, puoi utilizzare l'API di Amazon Polly per distribuire informazioni automatiche in tempo reale come lo stato del servizio, informazioni su account e fatturazione, indirizzi e informazioni di contatto.

Contact center clienti

Amazon Polly consente nuovi casi d'uso per Internet of Things (IoT) rendendo facile ed economico aggiungere sintesi vocale a dispositivi IoT. I dispositivi IoT possono utilizzare la sintesi vocale per fornire risposte e notifiche naturali, rendere le applicazioni più accessibili e consentire agli utenti di utilizzare informazioni senza bisogno di uno schermo. Con Amazon Polly puoi generare file audio e memorizzarli sui dispositivi per riprodurli offline.

Usa AWS Lambda per generare URL Polly pre-firmate basate su eventi del motore regole AWS IoT, poi usa Device Gateway per inviare queste URL ai tuoi dispositivi IoT per consentire la richiesta di voce naturale.

Internet of Things (IoT)

Amazon Polly può essere utilizzato per migliorare l'usabilità delle applicazioni per imparare a parlare nuove lingue. Per esempio, gli utenti finali possono digitare frasi in una lingua straniera nella tua applicazione e ascoltarne la pronuncia da una persona di madrelingua. Polly supporta 24 lingue, pertanto fornisce numerose opzioni a insegnanti e studenti.

Apprendimento delle lingue
Duolingo

"Non riesco a trovare molti casi d'uso nei quali la pronuncia corretta è più importante che i casi di apprendimento di una nuova lingua. Troviamo le voci di Amazon Polly non solo di grande qualità ma altrettanto valide che le voci umane naturali per insegnare una lingua."

– Severin Hacker, direttore tecnico, Duolingo


Con Amazon Polly puoi creare e distribuire informazioni accessibili sotto forma di sintesi vocale per utenti con problemi di vista. In questo modo si possono aiutare persone con disabilità visive a utilizzare contenuti di vario genere, come notizie, libri o messaggi e-mail.

Royal National Institute of Blind People

"Attualmente utilizziamo la tecnologia di sintesi vocale di Amazon per creare e distribuire informazioni accessibili sotto forma di contenuti audio sintetizzati per i nostri numerosi clienti B2B e B2C, fra cui società di erogazione di servizi, istituzioni finanziarie e aziende multimedia, oltre che altri materiali rivolti al cliente come riviste e pubblicazioni. Dopo l'annuncio di Amazon Polly, siamo entusiasti all'idea di fornire a questi clienti un'esperienza ancora migliore con la distribuzione di voci dal suono naturale che attireranno e coinvolgeranno il nostro pubblico."

– John Worsfold, Solutions Implementation Manager, Royal National Institute of Blind People

Iniziare a usare Amazon Polly molto semplice. Accedi alla console e inizia a generare sintesi vocale dal tuo testo in pochi clic.

Nozioni di base