Amazon Transcribe è un servizio di riconoscimento vocale automatico (ASR) basato su modelli di fondazione vocali che supporta oltre 100 lingue. Le funzionalità di Transcribe consentono di inserire input audio, di produrre trascrizioni facili da leggere e da rivedere, di migliorare la precisione con la personalizzazione e di filtrare i contenuti per garantire la privacy dei clienti.
Input audio
Transcribe è progettato per elaborare input audio o video dal vivo e registrati per fornire trascrizioni di alta qualità per la ricerca e l'analisi. Offriamo anche API separate che comprendono in modo univoco le chiamate dei clienti (Analisi delle chiamate di Amazon Transcribe) e le conversazioni mediche (Amazon Transcribe Medical).
Streaming e trascrizione in batch
Puoi elaborare le tue registrazioni audio esistenti o trasmettere l'audio in streaming per la trascrizione in tempo reale. Utilizzando una connessione protetta, puoi inviare un flusso audio dal vivo al servizio e ricevere un flusso di testo di ritorno.
Modelli specifici del dominio
Seleziona un modello adattato alle telefonate o ai contenuti video multimediali. Ad esempio, Transcribe si adatta all'audio telefonico a bassa fedeltà comune nei contact center.
Identificazione automatica della lingua
Con Amazon Transcribe, puoi identificare automaticamente la lingua dominante in un file audio e generare trascrizioni. Ciò è utile quando la libreria multimediale contiene file audio in diverse lingue. Puoi utilizzare questa funzione anche per la classificazione dei contenuti multimediali e verificare che la principale lingua parlata nei tuoi video e podcast sia etichettata correttamente.
Trascrizioni facili da leggere
Amazon Transcribe ti consente di produrre trascrizioni accurate facili da leggere, rivedere e integrare nelle tue applicazioni specifiche. Lavoriamo per preparare l'output per le attività a valle come l'analisi della trascrizione delle chiamate, la sottotitolazione e la ricerca di contenuti.
Punteggiatura e normalizzazione dei numeri
Amazon Transcribe aggiunge automaticamente la punteggiatura e la formattazione dei numeri in modo che l'output corrisponda esattamente alla qualità della trascrizione manuale con tempo e costi minimi. I numeri vengono anche trascritti in cifre o in "forma normale" anziché in parole.
Generazione di timestamp
Amazon Transcribe restituisce un timestamp per ogni parola, per consentire l'individuazione di una parola o frase nella registrazione originale o aggiungere sottotitoli a un video.
Riconoscimento di più partecipanti
Le modifiche dei partecipanti vengono automaticamente riconosciute e ricondotte al testo per acquisire con precisione scenari come telefonate, riunioni e programmi televisivi. Per saperne di più sull'identificazione dei partecipanti.
Identificazione dei canali
I contact center possono inviare un singolo file audio ad Amazon Transcribe e, in quel caso, il servizio genererà automaticamente una trascrizione della conversazione con etichette dei canali.
Personalizza il tuo output
La precisione è fondamentale e ti forniamo molte opzioni per personalizzare le trascrizioni in base alle tue esigenze aziendali specifiche e alla lingua parlata. Transcribe fornisce anche fino a 10 trascrizioni alternative per ogni frase, così puoi scegliere rapidamente l'opzione migliore che si applica al tuo contenuto e al tuo dominio. Ciò è utile per i flussi di lavoro di sottotitolazione umana in ciclo.
Vocabolario personalizzato
Con il vocabolario personalizzato puoi aggiungere nuove parole al vocabolario di base per generare trascrizioni più accurate per parole e frasi specifiche del dominio come nomi di prodotti, terminologia tecnica o nomi di persone.
Modelli di linguaggio personalizzati
Se necessario, puoi creare e addestrare il tuo modello linguistico personalizzato (CLM) per il tuo caso d'uso e dominio inviando un corpus di dati di testo ad Amazon Transcribe. Il CLM è una funzionalità adatta per migliorare la precisione del riconoscimento vocale con i propri dati.
Funzionalità di sicurezza e privacy degli utenti
Proteggere la privacy e la sicurezza dei clienti è fondamentale. Quando necessario, Transcribe ti permette di mascherare o rimuovere dai risultati delle trascrizioni le parole volgari o inadatte per il tuo pubblico grazie al filtro del vocabolario.
Filtro del vocabolario
Puoi specificare un elenco di parole da rimuovere dalle trascrizioni con il filtro del vocabolario. Puoi, ad esempio, specificare un elenco di parole oscene od offensive, quindi Amazon Transcribe le rimuoverà automaticamente dalle trascrizioni.
Redazione automatica di contenuti/informazioni di identificazione personale
Quando viene richiesto, Amazon Transcribe consente ai clienti di identificare e rivedere le Informazioni di identificazione personale (PII) sensibili dalle trascrizioni delle lingue supportate. Questa funzionalità consente ai contact center di rivedere e condividere facilmente le trascrizioni relative alle informazioni sull'esperienza cliente e alla formazione degli agenti.
Protezione dei dati
Proteggi i dati a riposo utilizzando la chiave Amazon S3 (SSE-S3) o specifica la tua chiave AWS Key Management Service. Amazon Transcribe utilizza TLS (Transport Layer Security) 1.2, un protocollo di crittografia che consente connessioni autenticate e il trasporto sicuro dei dati su Internet tramite HTTP, con certificati AWS per crittografare i dati in transito. Ciò include le trascrizioni in streaming.
Rilevamento di contenuti audio tossici
Amazon Transcribe Toxicity Detection utilizza il machine learning per mantenere le conversazioni audio civili e costruttive e incoraggiare un ambiente online sicuro e inclusivo. I contenuti audio tossici vengono contrassegnati in una delle diverse categorie in modo che i moderatori umani possano identificarli facilmente e intraprendere le azioni appropriate.
Analisi delle chiamate di Amazon Transcribe
Estrai informazioni sulle conversazioni, come il sentiment delle chiamate e il volume del parlato, per migliorare la produttività degli agenti e l'esperienza dei clienti con Analisi delle chiamate di Amazon Transcribe.
Miglioramento della produttività nei contact center con il riepilogo delle chiamate basato sull'IA generativa
Generazione automatica di riepiloghi delle chiamate per aiutare gli agenti a concentrarsi ad offrire esperienze eccellenti ai clienti e aumentare la produttività riducendo il riepilogo manuale dopo la chiamata. Questa funzionalità riassume un'interazione con un chiamante, acquisendo componenti chiave come il motivo della chiamata, le misure adottate per risolvere il problema e i passaggi successivi. I supervisori dei contact center possono esaminare i riepiloghi delle chiamate per comprendere rapidamente il contesto di un'interazione senza leggere l'intera trascrizione mentre ricercano i problemi del chiamante.
Estrazione di analisi dettagliate delle chiamate e approfondimenti sulle conversazioni
Sfruttando la potenza del machine learning, puoi applicare rapidamente le funzionalità speech-to-text e di elaborazione del linguaggio naturale per scoprire preziose informazioni sulle conversazioni. Puoi quindi integrare approfondimenti come il sentiment di clienti e agenti, i problemi rilevati e le caratteristiche vocali come il tempo di non conversazione, le interruzioni e la velocità di conversazione nelle tue applicazioni di analisi delle chiamate in entrata e in uscita. Ciò può aiutare i supervisori a identificare più prontamente i potenziali problemi dei clienti, le opportunità di formazione degli agenti e le tendenze delle chiamate.
Miglioramento della conformità e del monitoraggio con la categorizzazione automatica delle chiamate
Monitora le conversazioni su scala per verificarne la conformità con le policy aziendali o i requisiti normativi. Crea e addestra le tue categorie personalizzate in base ai criteri specificati (ad esempio, parole/frasi o caratteristiche della conversazione). Ad esempio, puoi impostare etichette di categoria per vedere quale percentuale di chiamate sono upsell o cancellazione dell'account.
Produzione di trascrizioni dettagliate delle chiamate
Consenti ai tuoi agenti di accedere ai dettagli delle conversazioni delle interazioni passate. Le trascrizioni dettagliate forniscono approfondimenti come il sentiment dei clienti, i problemi rilevati e le interruzioni.
Protezione dei dati sensibili dei clienti
Le conversazioni spesso contengono dati sensibili dei clienti come nomi, indirizzi, numeri di carte di credito e codici fiscali. Transcribe Call Analytics aiuta i clienti a identificare e oscurare queste informazioni sia dall'audio che dal testo.
Integrazioni con il contact center
Genesys Cloud CX
Genesys Cloud CX è una soluzione di contact center cloud che unifica le esperienze dei clienti e degli agenti su più canali come telefono, SMS e chat. Puoi trasmettere in streaming l'audio delle chiamate ad Amazon Transcribe dall'ambiente di Genesys Cloud per migliorare la produttività degli agenti ed estrarre informazioni sull'interazione con i clienti. Per ulteriori informazioni, consulta Integrazione di Genesys Cloud AudioHook. Inoltre, inizia ad analizzare le tue chiamate Genesys Cloud con la soluzione AWS Live Call Analytics.
SDK di Amazon Chime
SDK di Amazon Chime è costituito da una serie di componenti di comunicazione in tempo reale che gli sviluppatori possono utilizzare per aggiungere rapidamente chiamate audio, videochiamate e funzionalità di condivisione dello schermo alle proprie applicazioni Web, per dispositivi mobili o di telefonia.
Connettore voce Amazon Chime
Connettore voce Amazon Chime ti consente di integrarti facilmente con i contact center basati su SIP per generare trascrizioni live attribuite dagli utenti con Amazon Transcribe. Per ulteriori informazioni, consulta la documentazione di Connettore voce Amazon Chime.
Amazon Transcribe Medical
Specialità mediche
Trascrivi facilmente le tue conversazioni mediche con Transcribe Medical, un servizio di riconoscimento vocale automatico (ASR) idoneo all'HIPAA.
Modalità dettatura
Trascrivi accuratamente l'audio con un solo altoparlante che si trova comunemente nei casi d'uso della dettatura medica. Ulteriori informazioni »
Modalità conversazionale
Trascrivi accuratamente l'audio conversazionale composto da più altoparlanti composto da medici e/o pazienti. Ulteriori informazioni »
Trascrivi da voce a testo in una vasta gamma di specialità mediche. Ulteriori informazioni »
API batch
Trascrivi i file audio medici registrati su larga scala con elevata simultaneità. Ulteriori informazioni »
API di streaming
Trascrivi i flussi audio quasi in tempo reale tramite i protocolli WebSocket Secure o HTTP/2. Ulteriori informazioni »
Vocabolario personalizzato
Migliora l'accuratezza della trascrizione utilizzando un vocabolario personalizzato per una terminologia potenzialmente fuori dal lessico. Ulteriori informazioni »
Identificazione dei canali
Trascrivi contemporaneamente l'audio multicanale senza costi aggiuntivi. Ottieni un'ultima trascrizione coerente. Ulteriori informazioni »
Diarizzazione degli altoparlanti
Separa il parlato dei diversi altoparlanti all'interno di qualsiasi audio monocanale. Ulteriori informazioni »
Visita la pagina dei prezzi di Amazon Transcribe.
Ottieni l'accesso immediato al piano gratuito di AWS.
Inizia subito a utilizzare Amazon Transcribe nella Console di gestione AWS.