Domande generali

D: cos'è Amazon Transcribe?

Amazon Transcribe è un servizio AWS che semplifica la conversione di voce in testo. Grazie alla tecnologia di riconoscimento vocale automatizzato, i clienti potranno scegliere di utilizzare Amazon Transcribe per numerose applicazioni aziendali, tra cui trascrizione di chiamate di assistenza vocali con i clienti, generazione in tempo reale di sottotitoli e analisi basate su testo per contenuti audio e video.  

D: in che modo Amazon Transcribe interagisce con gli altri prodotti AWS? 

Amazon Transcribe converte gli input audio in testo, permettendo così l'utilizzo di diverse applicazioni di analisi dei testi. Ad esempio, è possibile utilizzare Amazon Comprehend sui testi ottenuti con Amazon Transcribe per analizzare le tendenze o estrarre entità e frasi chiave. In modo analogo, integrando Amazon Translate e Amazon Polly, è possibile accettare input vocali, tradurli in una lingua differente e generare un output vocale per ottenere conversazioni tra lingue diverse. È anche possibile integrare Amazon Transcribe con Amazon Elasticsearch per indicizzare librerie audio/video ed effettuarvi ricerche di testo. 

Utilizzo di Amazon Transcribe

D: in che modo accedono gli sviluppatori a Transcribe?

Il modo più semplice per iniziare a usare Amazon Transcribe è avviare un processo di trascrizione di un file audio tramite la console. Il servizio può però essere richiamato anche direttamente dall'interfaccia a riga di comando di AWS, oppure è possibile integrare con la propria applicazione uno dei kit SDK supportati. In ogni caso, è possibile iniziare a usare Amazon Transcribe per generare trascrizioni automatizzate di file audio tramite poche righe di codice.

D: che tipi di input supporta Amazon Transcribe?

Amazon Transcribe supporta flussi audio a 16 e 8 kHz e diverse codifiche audio, tra cui WAV, MP3, MP4 e FLAC.

D: Amazon Transcribe supporta le trascrizioni in tempo reale?

Sì. Amazon Transcribe consente agli utenti di aprire un flusso bidirezionale su HTTP2. Gli utenti possono inviare un flusso audio al servizio mentre allo stesso momento ricevono un flusso di testo in tempo reale.  

D: quale codifica supporta la trascrizione in tempo reale?

La trascrizione streaming attualmente supporta la codifica PCM lineare a 16 bit. 

D: quali lingue supporta Amazon Transcribe?

Per ulteriori informazioni sulle lingue supportate, consulta la pagina della documentazione

D: con quali dispositivi è compatibile Amazon Transcribe? 

Amazon Transcribe opera su quasi ogni dispositivo. In generale, è compatibile con tutti i dispositivi in cui sia integrato un microfono, ad esempio telefoni, PC, tablet e dispositivi IoT (ad es. sistemi audio per automobili). L'API di Amazon Transcribe è in grado di rilevare la qualità del flusso audio di input (8 kHz o 16 kHz) e selezionerà di conseguenza i modelli acustici idonei per la conversione di voce in testo. Inoltre, gli sviluppatori potranno richiamare l'API Transcribe tramite le loro applicazioni per dispositivi per utilizzare le funzionalità del servizio. 

D: sono previste restrizioni alle dimensioni dei contenuti audio elaborati da Amazon Transcribe?

Le chiamate di Amazon Transcribe sono limitate a 4 ore per chiamata API (o 2 GB) per il servizio in batch. Il servizio di streaming può ospitare connessioni aperte fino a 4 ore. 

D: quali linguaggi di programmazione supporta Amazon Transcribe?

Il servizio in batch di Amazon Transcribe supporta .NET, Go, Java, Javascript, PHP, Python e Ruby.
Il servizio in tempo reale di Amazon Transcribe supporta gli SDK Java, Ruby e C++. Supporto per ulteriori SDK a breve. Per ulteriori informazioni, consulta la pagina delle risorse

D: le parole del mio vocabolario personalizzato non vengono riconosciute! Cosa posso fare?

Il risultato del riconoscimento vocale dipende da una serie di fattori oltre alle voci del vocabolario personalizzato, quindi non è possibile avere alcuna certezza del fatto che se un termine è incluso nel vocabolario personalizzato viene riconosciuto correttamente.
Tuttavia, il motivo più frequente è l'assenza della pronuncia corretta della parola personalizzata. Se non è ancora stata fornita la pronuncia della parola personalizzata, crearne una. Se è già stata fornita, ricontrollarne la correttezza o includere altre varianti della pronuncia, se necessario. Per farlo è sufficiente creare nel file del vocabolario personalizzato più voci con pronunce diverse.

D: perché vedo un numero consistente di parole personalizzate nel mio output?

I vocabolari personalizzati sono ottimizzati per un breve elenco di parole mirate; vocabolari più consistenti comportano una generazione eccessiva di parole personalizzate, specie quando contengono parole che vengono pronunciate in modo simile. Se l'elenco di cui si dispone è lungo, tentare di ridurlo lasciando soltanto le parole rare e le parole che si prevede siano effettivamente presenti nei propri file audio. Se si dispone di un vocabolario consistente che interessa più casi d'uso, dividerlo in elenchi distinti in base ai diversi casi d'uso. Le parole che sono brevi e hanno un suono simile a quello di molte altre parole possono comportare una generazione eccessiva (presenza di troppe parole personalizzate nell'output). È preferibile unire queste parole alle parole vicine ed elencarle come frasi separate da un trattino. Ad esempio, la parola personalizzata "AD" potrebbe venire inclusa in una frase, ad esempio "Convertitore AD".

D: esistono due modi per fornire la pronuncia, i campi IPA o SoundsLike nella tabella del vocabolario personalizzato. Qual è il migliore?

Il metodo IPA consente una pronuncia molto più accurata. È bene fornire la pronuncia IPA se è possibile generare IPA (ad es. da un lessico che dispone della pronuncia IPA o da uno strumento di conversione online).

D: vorrei usare il metodo IPA ma non sono un esperto di linguistica. Esiste uno strumento online che posso utilizzare?

Numerosi dizionari standard, come l'Oxford English Dictionary o il Cambridge Dictionary (incluse le rispettive versioni online) forniscono la pronuncia secondo l'IPA. Esistono anche convertitori online (ad es. easypronunciation.com o tophonetics.com per l'inglese); tuttavia, nella maggior parte dei casi questi strumenti si basano su altri dizionari e potrebbero non generare l'IPA corretto per alcune parole, come i nomi propri. Amazon Transcribe non approva espressamente alcuno strumento di terze parti.

D: devo utilizzare standard IPA diversi specifici di un accento diverso nell'ambito della stessa lingua (ad es. Inglese USA o Inglese britannico)?

Occorre utilizzare lo standard IPA adatto ai file audio che verranno elaborati; ad es., se si prevede di elaborare un file audio di oratori che parlano in inglese britanni, utilizzare lo standard di pronuncia dell'Inglese britannico. La serie di simboli IPA consentiti può differire per le diverse lingue e i dialetti supportati da Amazon Transcribe; assicurarsi che le pronunce inserite contengano esclusivamente i caratteri consentiti. Per i dettagli sul set di caratteri IPA, consultare la documentazione https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html#charsets

D: come posso fornire la pronuncia servendomi del campo SoundsLike nella tabella del vocabolario personalizzato?

È possibile spezzare una parola o una frase in più porzioni e fornire la pronuncia per ciascuna porzione utilizzando l'ortografia standard della lingua per imitare il suono della parola. Ad esempio, in inglese si possono fornire i suggerimenti di pronuncia per la frase Los-Angeles in questo modo: loss-ann-gel-es. Il suggerimento per il nome Etienne avrebbe in inglese questo aspetto: eh-tee-en. Le diverse parti del suggerimento sono separate da un trattino (-). È anche possibile utilizzare uno qualsiasi dei caratteri consentiti nella lingua di immissione.

D: come funziona quando esistono due modi diversi di fornire gli acronimi (con i punti e senza punti ma con la pronuncia)?

Se si usa un acronimo che contiene i punti, la pronuncia delle varie lettere viene generata internamente. Se non si usano i punti, occorre fornire la pronuncia nell'apposito campo. Per alcuni acronimi, non è evidente se dispongano di una pronuncia per lettera o una pronuncia come fossero parole (ad es. NATO si pronuncia spesso ‘n eɪ t oʊ’ (nay-toh) anziché ‘ɛn eɪ ti oʊ’ (N. A. T. O.)).

D: dove posso trovare esempi di come utilizzare le pronunce standard?

Esempi dei formati di immissione sono disponibili nella documentazione: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html.

D: cosa succede se utilizzo un'IPA errata? Se non sono sicuro, è meglio che eviti di inserire l'IPA?

Il sistema utilizzerà la pronuncia fornita dall'utente; in tal modo aumentano le possibilità che la parola venga riconosciuta correttamente se la pronuncia è corretta e corrisponde a quanto è stato detto. Se non si è certi di poter generare l'IPA corretta, è consigliabile eseguire un confronto elaborando i propri file audio con un vocabolario che contenga le proprie pronunce IPA e con un vocabolario che contenga soltanto le parole (e, facoltativamente, i tipi di visualizzazione). Se non si fornisce alcuna pronuncia, il servizio utilizzerà un'approssimazione, che potrebbe o meno funzionare meglio di quanto è stato immesso.

D: quando si usano i moduli DisplayAs, posso visualizzare i set di caratteri che non hanno alcuna relazione con la lingua originale che si sta trascrivendo (ad es. output di “Street” come “街道“).

Sì. Anche se le frasi possono utilizzare soltanto un set limitato di caratteri per la lingua specificata, i caratteri UTF-8 diversi da \t (TAB) sono consentiti nella colonna DisplayAs.

Prezzi e disponibilità

D: quanto costa?

Consulta la pagina dei prezzi di Amazon Transcribe per ulteriori informazioni.

D: in quali regioni AWS è disponibile Amazon Transcribe?

Consulta la Tabella delle regioni per l'infrastruttura globale di AWS.

Privacy dei dati

D: In che modo AWS utilizza gli input vocali elaborati e salvati da Amazon Transcribe?

Amazon Transcribe può memorizzare e utilizzare gli input vocali elaborati dal servizio, esclusivamente per erogare e mantenere attivo il servizio, oltre a migliorare e sviluppare la qualità di Amazon Transcribe e di altre tecnologie di Machine Learning e Intelligenza Artificiale di Amazon. L'utilizzo dei contenuti è importante nell'ottica di miglioramento costante dell'esperienza utente di Amazon Transcribe, nonché per lo sviluppo e la formazione di tecnologie correlate. Amazon non utilizzerà eventuali informazioni che consentono l'identificazione personale, presenti nei tuoi contenuti, per creare prodotti, servizi o materiale di marketing mirati a te o ai tuoi utenti finali. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli scrupolosi e sofisticati, sia tecnici sia fisici (inclusa la crittografia su dati in transito e inattivi), progettati per impedire accessi non autorizzati e divulgazione di informazioni riservate e garantire che l'utilizzo dei contenuti da parte nostra sia conforme agli impegni presi nei tuoi confronti. Per ulteriori informazioni consultare la pagina https://aws.amazon.com/compliance/data-privacy-faq/. Puoi scegliere di non utilizzare i contenuti per migliorare e sviluppare la qualità di Amazon Transcribe e di altre tecnologie di Machine Learning e Intelligenza Artificiale di Amazon, contattando AWS Support.

D: è possibile eliminare gli input vocali memorizzati in Amazon Transcribe?

Sì. Puoi richiedere l'eliminazione degli input vocali associati al tuo account contattando AWS Support. L'eliminazione degli input vocali potrà però rendere meno completa l'esperienza di utilizzo di Amazon Transcribe.

D: chi avrà accesso ai contenuti elaborati e memorizzati da Amazon Transcribe?

Solo i dipendenti autorizzati potranno accedere ai contenuti elaborati da Amazon Transcribe. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli scrupolosi e sofisticati, sia tecnici sia fisici (inclusa la crittografia su dati in transito e inattivi), progettati per impedire accessi non autorizzati e divulgazione di informazioni riservate e garantire che l'utilizzo dei contenuti da parte nostra sia conforme agli impegni presi nei tuoi confronti. Per ulteriori informazioni consultare la pagina https://aws.amazon.com/compliance/data-privacy-faq/.

D: i contenuti elaborati e memorizzati da Amazon Transcribe rimangono di mia proprietà?

I contenuti rimarranno di tua proprietà; Amazon li userà solo previo consenso.

D: i contenuti elaborati da Amazon Transcribe vengono trasferiti all'esterno della regione AWS in cui è in uso il servizio?

I contenuti elaborati da Amazon Transcribe vengono crittografati e memorizzati su disco nella regione AWS in cui è in uso Amazon Transcribe. I contenuti elaborati da Amazon Transcribe possono essere parzialmente archiviati in un'altra regione AWS, esclusivamente con la finalità di un miglioramento costante e dello sviluppo della tua esperienza di cliente Amazon Transcribe e di altre tecnologie di Machine Learning e Intelligenza Artificiale di Amazon. Se scegli di non utilizzare i contenuti per migliorare e sviluppare la qualità di Amazon Transcribe e di altre tecnologie di Machine Learning e Intelligenza Artificiale di Amazon, i tuoi contenuti non verranno archiviati in un'altra regione AWS. Puoi richiedere l'eliminazione degli input vocali associati al tuo account contattando AWS Support. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli adeguati e sofisticati, a livello tecnico e fisico, tra cui la crittografia sia in condizioni statiche che durante i trasferimenti, per impedire gli accessi non autorizzati e la divulgazione dei contenuti e per garantire che l'utilizzo da parte nostra sia conforme ai nostri impegni nei tuoi confronti. Per ulteriori informazioni consultare la pagina https://aws.amazon.com/compliance/data-privacy-faq/.

D: è possibile utilizzare Amazon Transcribe in connessione con siti web, programmi o altre applicazioni rivolti o destinati a minori di 13 anni e soggette alle norme previste dal Children's Online Privacy Protection Act (COPPA)?

Sì; in conformità con i Termini del servizio di Amazon Transcribe, nonché adempiuto l'obbligo di fornire il necessario preavviso e ottenuto l'eventuale consenso dei genitori secondo quanto prescritto dal COPPA, sarà possibile utilizzare il servizio in connessione con siti web, programmi o altre applicazioni rivolti o destinati, del tutto o in parte, ai minori di 13 anni.

D: in che modo è possibile determinare se un sito web, un programma o un'applicazione sono soggetti al COPPA?

Per ottenere informazioni sui requisiti del COPPA e linee guida su come determinare se un sito web, programma o applicazione è soggetta al COPPA, consulta direttamente le risorse fornite dalla United States Federal Trade Commission. Il sito offre informazioni su come determinare se un servizio è rivolto o destinato, del tutto o in parte, ai minori di 13 anni.

Ulteriori informazioni sui prezzi di Amazon Transcribe

Visita la pagina dei prezzi
Sei pronto per iniziare?
Prova la console di Amazon Transcribe
Hai altre domande?
Contattaci