Crea una trascrizione audio

con Amazon Transcribe

Seguendo questo tutorial dettagliato imparerai come usare Amazon Transcribe per creare la trascrizione di un file audio registrato, mediante la console di gestione AWS. Amazon Transcribe è un servizio di riconoscimento vocale automatico (ASR) che assiste gli sviluppatori nell’aggiunta di funzionalità di sintesi vocale alle proprie applicazioni. Utilizzando l'API Amazon Transcribe puoi analizzare i file audio memorizzati in Amazon Simple Storage Service (S3) e far sì che il servizio restituisca un file di testo con il discorso trascritto.

Per gli sviluppatori, creare trascrizioni delle chiamate al servizio clienti o generare sottotitoli per i contenuti audio e video sono sfide frequenti che richiedono capacità di sintesi vocale. I problemi possono essere risolti creando i propri modelli di machine learning da zero. Tuttavia, si tratta di una soluzione dispendiosa in termini di tempo e denaro, che inoltre richiede una certa esperienza di machine learning. Invece di percorrere la strada più difficile, puoi usare Amazon Transcribe, un servizio pre-addestrato e completamente gestito in grado di fornire trascrizioni veloci e di qualità elevata.

Durante questo tutorial scaricherai un file audio campione per poi caricarlo sul bucket S3 che creerai. Quindi utilizzerai Amazon Transcribe per creare una trascrizione dell'audio campione usando la console di gestione AWS.

Questo tutorial è un demo delle funzionalità disponibili quando usi l’interfaccia a riga di comando (CLI) di AWS o l'API Transcribe. Per implementazioni in produzione o di proof of concept, consigliamo di adottare queste interfacce programmatiche invece della console di Amazon Transcribe.

Questo tutorial richiede un account AWS

Iniziare a usare il servizio con il piano gratuito di Amazon Transcribe è semplice. Trascrivi fino a 60 minuti di audio al mese, gratis per 12 mesi dalla creazione del tuo account AWS.

Ulteriori informazioni sul piano gratuito >>


Fase 1. Crea un bucket S3 e carica un file audio di esempio

In questa fase dovrai scaricare un file audio di esempio, creare un bucket S3 e poi caricare il file di esempio sul bucket S3. Transcribe accede ai file audio e video da trascrivere esclusivamente dai bucket S3.


a.  Facendo clic qui potrai scaricare il file audio di esempio, che dovrai trascrivere nelle fasi successive del tutorial. Il nome del file è transcribe-sample.mp3.


b.  Facendo clic qui, la Console di gestione AWS si aprirà in una nuova finestra del browser, per consentirti di mantenere aperta questa guida dettagliata. Quando viene caricata la schermata, inserisci nome utente e password per iniziare. Dal menù a discesa Regione, seleziona una regione in cui Amazon Transcribe è disponibile.

Quando questo articolo è stato scritto, Amazon Transcribe era disponibile nelle regioni Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio), Stati Uniti occidentali (Oregon), Asia Pacifico (Sydney), Canada (Centrale) e UE (Irlanda).

create-audio-transcript-transcribe-step-1b
create-audio-transcript-transcribe-step-1b

(fai clic per ingrandire l'immagine)


c. Digita S3 nella barra di ricerca e seleziona S3 per aprire la console.

create-audio-transcript-transcribe-step-1c
create-audio-transcript-transcribe-step-1c

(fai clic per ingrandire l'immagine)


d.  Nel pannello di controllo di S3, seleziona Crea bucket.

Se è la prima volta che crei un bucket, verrà visualizzata una schermata simile all'immagine mostrata.

Se hai già creato bucket S3, nel tuo pannello di controllo S3 verranno visualizzati tutti i bucket che hai creato.

create-audio-transcript-transcribe-step-1d
create-audio-transcript-transcribe-step-1d

(fai clic per ingrandire l'immagine)


e.  Inserisci un nome univoco per il bucket. I nomi dei bucket devono essere univoci per tutti i nomi di bucket esistenti in Amazon S3. Sono inoltre previste altre restrizioni sui nomi dei bucket S3. Quindi seleziona una regione nella quale creare il tuo bucket.

Seleziona Successivo.

create-audio-transcript-transcribe-step-1e
create-audio-transcript-transcribe-step-1e

(fai clic per ingrandire l'immagine)


f.  Sono disponibili numerose opzioni utili per il tuo bucket S3, tra cui Funzione versioni multiple, Registrazione di log di accesso al server, Tag, Registrazione a livello di oggetto e Crittografia predefinita. In questo tutorial non sarà necessario attivare queste caratteristiche.

Seleziona Successivo.

create-audio-transcript-transcribe-step-1f
create-audio-transcript-transcribe-step-1f

(fai clic per ingrandire l'immagine)


g.  In questa fase potrai modificare le impostazioni delle autorizzazioni per il tuo bucket S3, durante il processo di creazione dello stesso.

Lascia i valori di default e seleziona Successivo.

create-audio-transcript-transcribe-step-1g
create-audio-transcript-transcribe-step-1g

(fai clic per ingrandire l'immagine)


h.  Rivedi le impostazioni di configurazione e seleziona Crea bucket.

create-audio-transcript-transcribe-step-1h
create-audio-transcript-transcribe-step-1h

(fai clic per ingrandire l'immagine)


i.  Il tuo bucket sarà visualizzato nella console S3. Fai clic sul nome del bucket per accedervi. Il nome del bucket non sarà quello mostrato nell'immagine a destra.

create-audio-transcript-transcribe-step-1i
create-audio-transcript-transcribe-step-1i

(fai clic per ingrandire l'immagine)


j. Sei nella home page del tuo bucket.

Seleziona Carica.

create-audio-transcript-transcribe-step-1j
create-audio-transcript-transcribe-step-1j

(fai clic per ingrandire l'immagine)


k.  Carica il file transcribe-sample.mp3 facendo clic su Aggiungi file e selezionando il file OPPURE trascinando il file transcribe-sample.mp3 nella finestra di caricamento.

Seleziona Carica.

create-audio-transcript-transcribe-step-1k
create-audio-transcript-transcribe-step-1k

(fai clic per ingrandire l'immagine)


l.  Seleziona la casella accanto al file transcribe-sample.mp3 nel tuo bucket. Per transcribe-sample.mp3 verrà mostrata una scheda con tutti i dettagli del file. Copia il link al file e salvalo per utilizzarlo nelle fasi successive di questo tutorial.

create-audio-transcript-transcribe-step-1l
create-audio-transcript-transcribe-step-1l

(fai clic per ingrandire l'immagine)


Fase 2. Crea un'attività di trascrizione

In questa fase dovrai creare ed eseguire un'attività di trascrizione attraverso la console Amazon Transcribe.


a.  Dalla barra dei menù in alto, seleziona Servizi e inizia a digitare Transcribe nella barra di ricerca, poi seleziona Amazon Transcribe per aprire la console del servizio.

create-audio-transcript-transcribe-step-2a
create-audio-transcript-transcribe-step-2a

(fai clic per ingrandire l'immagine)


b.  Nella pagina principale della console Amazon Transcribe, apri il riquadro di navigazione e fai clic su Attività di trascrizione.

c. Nella pagina Attività di trascrizione, fai clic su Crea attività.

create-audio-transcript-transcribe-step-2b
create-audio-transcript-transcribe-step-2b

(fai clic per ingrandire l'immagine)


d.  Nella pagina Crea attività di trascrizione, nel campo Nome scrivi sample-transcription-job.

Conferma inglese come lingua predefinita.

Nel campo Posizione del file di input su S3, incolla il link al file di esempio nel tuo bucket S3. Il link al file di esempio sarà diverso da quello mostrato nell'immagine a destra.  

Conferma mp3 come Formato predefinito.

Puoi usare la funzionalità Vocabolario personalizzato per aiutare Amazon Translate a riconoscere parole e frasi specifiche per la tua applicazione, ad esempio i nomi non inglesi come Etienne. Non utilizzerai questa funzionalità in questo tutorial.

create-audio-transcript-transcribe-step-2c
create-audio-transcript-transcribe-step-2c

(fai clic per ingrandire l'immagine)


e.  Conferma Amazon default comePosizione dei dati predefinita.

Se abiliti l'opzione Identificazione di canale, Amazon Transcribe sarà in grado di processare audio in cui ciascuna voce viene registrata su canali diversi e di creare una trascrizione unica con etichette diverse per ogni canale.

Se l'opzione Identificazione speaker è abilitata, Amazon Transcribe riconosce i cambi di voce e attribuisce il testo trascritto in modo conforme.

Nessuna di queste opzioni viene usata in questo tutorial.

Seleziona Crea per iniziare l'attività di trascrizione.  

create-audio-transcript-transcribe-step-2d
create-audio-transcript-transcribe-step-2d

(fai clic per ingrandire l'immagine)


Fase 3. Verifica i risultati della trascrizione

In questa fase scoprirai come verificare lo stato di avanzamento e controllare i risultati della tua attività di trascrizione.


a.  Dopo aver fatto clic sul pulsante Crea, si aprirà la schermata Attività di trascrizione. Qui potrai vedere lo stato di sample-transcription-job. Lo stato può essere In corso, Completata o Non riuscita.

Se lo stato è Completata, fai clic sul link a sample-transcription-job nella colonna Nome per vedere i risultati della trascrizione.

create-audio-transcript-transcribe-step-3a
create-audio-transcript-transcribe-step-3a

(fai clic per ingrandire l'immagine)


b.   Quindi potrai verificare i dettagli di sample-transcription-job. Scorri verso il basso fino al pannello Trascrizione per vedere il risultato dell'attività di trascrizione. Nel riquadro JSON puoi vedere i risultati della trascrizione, esattamente come quelli restituiti dall'API Transcribe o dall'interfaccia a riga di comando (CLI) di AWS.

create-audio-transcript-transcribe-step-3b
create-audio-transcript-transcribe-step-3b

(fai clic per ingrandire l'immagine)


Fase 4. Arresta le risorse

In questa fase dovrai eliminare il file campione dal tuo bucket S3, per evitare di incorrere in addebiti indesiderati.


a.  Nel menù di navigazione superiore fai clic su Servizi e digita S3 nella barra di ricerca, poi seleziona S3 per aprire la console.

create-audio-transcript-transcribe-step-4a
create-audio-transcript-transcribe-step-4a

(fai clic per ingrandire l'immagine)


b.  Scorri fino ai tuoi bucket S3 e individua il bucket che avevi creato all'inizio di questo tutorial. Fai clic sul nome del bucket per visualizzarne i contenuti. Il nome del bucket non corrisponde a quello mostrato nell'immagine a destra.

create-audio-transcript-transcribe-step-4b
create-audio-transcript-transcribe-step-4b

(fai clic per ingrandire l'immagine)


c.  Seleziona il file transcribe-sample.mp3 contenuto nel tuo bucket e, dal menù Azioni, seleziona Elimina. Conferma l'eliminazione.

create-audio-transcript-transcribe-step-4c
create-audio-transcript-transcribe-step-4c

(fai clic per ingrandire l'immagine)


Congratulazioni!

Come hai potuto vedere in questo tutorial, Amazon Transcribe consente di trasformare la voce in testo in base alle tue esigenze. Puoi usare Amazon Transcribe per una vasta gamma di file audio o video, per esempio chiamate al servizio clienti, riunioni aziendali, programmi televisivi e video on demand.

 

Impara a tradurre testi in modo adattabile

Scopri come tradurre in altre lingue i testi trascritti grazie ad Amazon Translate, guardando questo tutorial di 10 minuti.

Inizia a usare API Transcribe e CLI

Scopri come usare l'API Amazon Transcribe e l'interfaccia a riga di comando (CLI) in questo tutorial all'interno della nostra documentazione.

Esplora Amazon Comprehend

Guarda questo tutorial di 10 minuti per scoprire come analizzare le emozioni in un testo con Amazon Comprehend.