Amazon Transcribe

Riconoscimento vocale automatico

Amazon Transcribe è un servizio di riconoscimento vocale automatico (ASR) che semplifica agli sviluppatori il compito di aggiungere capacità di sintesi vocale alle proprie applicazioni. Utilizzando l'API Amazon Transcribe puoi analizzare i file audio memorizzati in Amazon S3 e far sì che il servizio restituisca un file di testo del discorso trascritto.

Amazon Transcribe può essere utilizzato per moltissime applicazioni comuni, tra cui la trascrizione di chiamate all'assistenza clienti e la creazione di sottotitoli per contenuti audio e video. Il servizio può trascrivere file audio archiviati in formati comuni, come WAV e MP3, con time stamp per ogni parola, permettendoti di individuare facilmente l'audio nella fonte originale cercando il testo. Amazon Transcribe continua a imparare e a migliorare per stare al passo con l'evoluzione della lingua.

AWS re:Invent 2017 Introduzione ad Amazon Transcribe

Caratteristiche principali

Trascrizioni di facile lettura

La maggior parte dei sistemi di riconoscimento vocale emettono una stringa di testo senza segni di punteggiatura. Amazon Transcribe utilizza l'apprendimento approfondito per aggiungere automaticamente punteggiatura e formattazione, in modo che il risultato sia più leggibile e possa essere utilizzato senza ulteriori modifiche.

Supporto per audio di qualità telefonica

L'audio registrato dalle conversazioni telefoniche è in genere di bassa qualità. Amazon Transcribe è stato specificamente progettato per fornire un'elevata precisione quando si lavora con audio di qualità telefonica per consentire casi d'uso come la trascrizione delle chiamate all'assistenza clienti.  

Più lingue

Amazon Transcribe può trascrivere automaticamente discorsi in inglese (USA) e spagnolo. Presto sarà disponibile il supporto per altre lingue.    

 

API semplice da utilizzare

L'API Amazon Transcribe semplifica la conversione di voce in testo. Non è richiesta alcuna programmazione complicata. Basta richiamare l'API con alcune righe di codice e Transcribe restituirà il testo dal tuo file audio memorizzato in Amazon S3.

Supporto per vocabolario personalizzato (disponibile a breve)

Amazon Transcribe ti dà la possibilità di espandere e personalizzare il tuo vocabolario di riconoscimento vocale. Puoi aggiungere nuove parole (assieme alle loro pronunce) al vocabolario di base e generare trascrizioni altamente accurate specifiche per il tuo caso d'uso, anche quando le enunciazioni possono includere terminologia specifica e gergo o nomi di prodotti univoci. Questa funzione ti consente di risparmiare tempo e modifiche aggiuntive eliminando la necessità di apportare correzioni nel corso del tempo.

Generazione di time stamp

Amazon Transcribe restituisce un time stamp per ogni parola, così che tu possa individuare facilmente l'audio nella registrazione originale cercando il testo.

 

Riconoscere le voci di più persone (disponibile a breve)

Amazon Transcribe è in grado di riconoscere quando l'oratore cambia e attribuire in modo appropriato il testo trascritto. Ciò può ridurre significativamente la quantità di lavoro necessario per trascrivere l'audio con più oratori, come nel caso di telefonate, interviste e spettacoli televisivi.

Casi d'uso

Amazon Transcribe può fornire la trascrizione per una vasta gamma di casi d'uso tra cui assistenza clienti, sottotitoli, ricerca e conformità.

Migliorare l'assistenza clienti

Convertendo l'input audio in testo, Amazon Transcribe ti consente di creare applicazioni di analisi del testo in grado di cercare e analizzare l'input vocale. I contact center dei clienti possono utilizzare Amazon Transcribe per trascrivere le interazioni vocali ed estrarre i dati per ottenere informazioni utilizzando altri servizi AWS come Amazon Comprehend per estrarre significato e intenzioni dalle conversazioni.

Flussi di lavoro di didascalie/sottotitoli

Amazon Transcribe può aiutare i distributori di contenuti multimediali e di generazione di contenuti a migliorare la diffusione e l'accesso generando automaticamente sottotitoli con time stamp che possono essere visualizzati insieme ai contenuti video.

Catalogazione di archivi audio

Il servizio ti consente di trascrivere risorse audio e video in archivi completamente ricercabili per il monitoraggio della conformità e la gestione dei rischi. I clienti possono usare Amazon Transcribe per convertire l'audio in testo e usare Amazon ElasticSearch per indicizzare ed eseguire ricerche basate su testo attraverso la loro libreria audio/video.

Referenze dei clienti

RingDNA è un motore di accelerazione delle vendite e una piattaforma di comunicazioni vocali aziendali. I team di vendite interni usano RingDNA per aumentare fortemente la produttività, avere conversazioni di vendita più brillanti, acquisire informazioni previsionali sulle vendite e insegnare ai rappresentanti come arrivare rapidamente al successo. 

"RingDNA è una piattaforma di comunicazioni end-to-end per i team di vendite. Centinaia di organizzazioni aziendali usano RingDNA per aumentare fortemente la produttività, avere conversazioni di vendita più brillanti, acquisire informazioni previsionali sulle vendite, migliorare la percentuale di successi e insegnare ai rappresentanti come arrivare rapidamente a risultati molto soddisfacenti. Conversation AI, componente fondamentale di RingDNA, richiede la sintesi vocale migliore per offrire le trascrizioni di ogni telefonata. RingDNA è entusiasta di Amazon Transcribe poiché fornisce un riconoscimento vocale di alta qualità su larga scala, aiutandoci a trascrivere meglio in testo ogni chiamata."

Howard Brown – CEO e fondatore,  RingDNA

Isentia, con sede a Sydney, Australia, è un fornitore leader di media intelligence per la regione Asia-Pacifico. La società opera da 18 uffici in tutta la regione e supporta più di 5.000 clienti in tutto il mondo, fra cui 84 delle prime 100 marche mondiali. I prodotti di Isentia aiutano i clienti a prendere decisioni aziendali e di comunicazione più informate e tempestive.

"In Isentia, permettiamo ai clienti di analizzare e monitorare la rassegna stampa sui loro marchi. Creiamo oltre 13.000 riepiloghi al giorno da contenuti radiofonici e televisivi. Grazie ad Amazon Transcribe, possiamo trascrivere tutto il contenuto audio/video che monitoriamo e analizzare i dati testuali con Amazon Clair. Funzionalità come time stamp e punteggiatura rendono molto facile per noi cercare tra i dati, approfondire la ricerca e presentare ai nostri clienti le informazioni chiave che devono esaminare."

Andrea Walsh – CIO, Isentia

Ulteriori informazioni sui prezzi di Amazon Transcribe

Visita la pagina dei prezzi
Sei pronto per iniziare?
Registrati per l'anteprima
Hai domande?
Contattaci