Domande generali

D: Cos'è Amazon Transcribe?

Amazon Transcribe è un servizio AWS di Intelligenza Artificiale (IA) che semplifica la conversione di voce in testo. Grazie alla tecnologia di riconoscimento vocale automatizzato, puoi utilizzare Amazon Transcribe per numerose applicazioni aziendali, tra cui trascrizione di chiamate di assistenza vocali con i clienti, generazione in tempo reale di sottotitoli e analisi basate su testo per contenuti audio e video.  

D: in che modo Amazon Transcribe interagisce con gli altri prodotti AWS? 

Amazon Transcribe converte gli input audio in testo, permettendo così l'utilizzo di diverse applicazioni di analisi dei testi. Ad esempio, utilizzando Amazon Comprehend sui dati di testo convertito da Amazon Transcribe, puoi eseguire l'analisi le tendenze o estrarre entità e frasi chiave. In modo analogo, integrando Amazon Translate e Amazon Polly, puoi accettare input vocali in una lingua, tradurli in un'altra e generare un output vocale, consentendo in questo modo una conversazione in lingue diverse. È anche possibile integrare Amazon Transcribe con Amazon Kendra o Amazon OpenSearch per indicizzare ed eseguire ricerche basate su testo in una libreria audio/video. Per ulteriori informazioni, consulta la soluzione Analisi dei dati delle chiamate e assistenza agli agenti in tempo reale, Analisi post chiamate, MediaSearch o Analisi dei contenuti.

D: Cos'altro dovrei sapere prima di utilizzare il servizio Amazon Transcribe?

Amazon Transcribe è progettato per gestire una vasta gamma di caratteristiche vocali e acustiche, comprese le variazioni di volume, tono e velocità del parlato. La qualità e il contenuto del segnale audio (inclusi, a titolo indicativo, fattori quali rumore di fondo, altoparlanti sovrapposti, accento o passaggi tra lingue diverse in un unico file audio) possono influenzare l'accuratezza dell'uscita del servizio. Aggiorniamo costantemente il servizio per migliorare la sua capacità di accogliere variazioni acustiche e tipi di contenuti ulteriori.

Utilizzo di Amazon Transcribe

D: In che modo gli sviluppatori accederanno ad Amazon Transcribe?

Il modo più semplice per iniziare è avviare un processo di trascrizione di un file audio tramite la console. Il servizio può però essere richiamato anche direttamente dall'interfaccia a riga di comando di AWS, oppure è possibile integrare con la propria applicazione uno dei kit SDK supportati. In ogni caso, è possibile iniziare a usare Amazon Transcribe per generare trascrizioni automatizzate di file audio tramite poche righe di codice.

D: Amazon Transcribe supporta le trascrizioni in tempo reale?

Sì. Amazon Transcribe consente di aprire un flusso bidirezionale su HTTP2. Puoi inviare un flusso audio al servizio e ricevere nello stesso momento un flusso di testo in tempo reale. Per maggiori dettagli, consulta la documentazione.

D: quale codifica supporta la trascrizione in tempo reale?

I tipi di media supportati fanno differenza tra trascrizioni in batch e trascrizioni in streaming, sebbene i formati senza perdita di dati siano consigliati per entrambi. Per maggiori dettagli, consulta la documentazione.

D: Quali lingue supporta Amazon Transcribe?

Per ulteriori informazioni sulle lingue supportate, consulta la pagina della documentazione.

D: con quali dispositivi è compatibile Amazon Transcribe? 

Amazon Transcribe opera su quasi ogni dispositivo. In generale, è compatibile con tutti i dispositivi in cui sia integrato un microfono, come telefoni, PC, tablet e dispositivi IoT (ad esempio, sistemi audio per automobili). L'API di Amazon Transcribe è in grado di rilevare la qualità del flusso audio di input (8 kHz o 16 kHz) e selezionerà di conseguenza i modelli acustici idonei per la conversione di voce in testo. Inoltre, gli sviluppatori potranno richiamare l'API Amazon Transcribe tramite le loro applicazioni per dispositivi per utilizzare le funzionalità del servizio.

D: sono previste restrizioni alle dimensioni dei contenuti audio elaborati da Amazon Transcribe?

Le chiamate di servizio di Amazon Transcribe sono limitate a quattro ore (o 2 GB) per chiamata API per il servizio in batch. Il servizio di streaming può ospitare connessioni aperte fino a 4 ore.

D: Quali linguaggi di programmazione supporta Amazon Transcribe?

Il servizio in batch di Amazon Transcribe supporta .NET, Go, Java, Javascript, PHP, Python e Ruby. Il servizio in tempo reale di Amazon Transcribe supporta gli SDK Java, Ruby e C++. È in arrivo un ulteriore supporto per SDK. Per maggiori dettagli, consulta la pagina Risorse e la documentazione.

D: Le parole del mio vocabolario personalizzato non vengono riconosciute! Cosa posso fare?

Il risultato del riconoscimento vocale dipende da una serie di fattori oltre alle voci del vocabolario personalizzato, quindi non è possibile avere alcuna certezza del fatto che se un termine è incluso nel vocabolario personalizzato viene riconosciuto correttamente. Tuttavia, il motivo più frequente è l'assenza della pronuncia corretta della parola personalizzata. Se non è ancora stata fornita la pronuncia della parola personalizzata, crearne una. Se è già stata fornita, ricontrollarne la correttezza o includere altre varianti della pronuncia, se necessario. Per farlo è sufficiente creare nel file del vocabolario personalizzato più voci con pronunce diverse. Consulta la documentazione relativa al vocabolario personalizzato per maggiori informazioni.

D: Perché vedo un numero consistente di parole personalizzate nel mio output?

I vocabolari personalizzati sono ottimizzati per un breve elenco di parole mirate; vocabolari più consistenti comportano una generazione eccessiva di parole personalizzate, specie quando contengono parole che vengono pronunciate in modo simile. Se l'elenco di cui si dispone è lungo, tentare di ridurlo lasciando soltanto le parole rare e le parole che si prevede siano effettivamente presenti nei propri file audio. Se disponi di un vocabolario consistente che interessa più casi d'uso, dividilo in elenchi distinti in base ai diversi casi d'uso. Le parole che sono brevi e hanno un suono simile a quello di molte altre parole possono comportare una generazione eccessiva (presenza di troppe parole personalizzate nell'output). È preferibile unire queste parole alle parole vicine ed elencarle come frasi separate da un trattino. Ad esempio, la parola personalizzata "AD" potrebbe venire inclusa in una frase, ad esempio "Convertitore AD".

D: Esistono due modi per fornire la pronuncia, i campi IPA o SoundsLike nella tabella del vocabolario personalizzato. Qual è il migliore?

Il metodo IPA consente una pronuncia molto più accurata. È bene fornire la pronuncia IPA se è possibile generare IPA (ad esempio, da un lessico che dispone della pronuncia IPA o da uno strumento di conversione online).

D: vorrei usare il metodo IPA ma non sono un esperto di linguistica. Esiste uno strumento online che posso utilizzare?

Numerosi dizionari standard, come l'Oxford English Dictionary o il Cambridge Dictionary (incluse le rispettive versioni online) forniscono la pronuncia secondo l'IPA. Esistono anche convertitori online (ad es. easypronunciation.com o tophonetics.com per l'inglese); tuttavia, nella maggior parte dei casi questi strumenti si basano su altri dizionari e potrebbero non generare l'IPA corretto per alcune parole, come i nomi propri. Amazon Transcribe non approva espressamente alcuno strumento di terze parti.

D: devo utilizzare standard IPA diversi specifici di un accento diverso nell'ambito della stessa lingua (ad esempio, Inglese USA o Inglese britannico)?

È necessario utilizzare lo standard IPA appropriato per i file audio che verranno elaborati. Ad esempio, se prevedi di elaborare l'audio da persone che parlano inglese britannico, utilizza lo standard di pronuncia inglese britannico. La serie di simboli IPA consentiti può differire per le diverse lingue e i dialetti supportati da Amazon Transcribe; assicurarsi che le pronunce inserite contengano esclusivamente i caratteri consentiti. I dettagli sui set di caratteri IPA sono disponibili nella documentazione: Vocabolari personalizzati

D: Come posso fornire la pronuncia servendomi del campo SoundsLike nella tabella del vocabolario personalizzato?

È possibile spezzare una parola o una frase in più porzioni e fornire la pronuncia per ciascuna porzione utilizzando l'ortografia standard della lingua per imitare il suono della parola. Ad esempio, in inglese si possono fornire i suggerimenti di pronuncia per la frase Los-Angeles in questo modo: loss-ann-gel-es. Il suggerimento per il nome Etienne avrebbe in inglese questo aspetto: eh-tee-en. Le diverse parti del suggerimento sono separate da un trattino (-). È anche possibile utilizzare uno qualsiasi dei caratteri consentiti nella lingua di immissione. Per maggiori informazioni, visita la pagina Vocabolari personalizzati.

D: Come funziona quando esistono due modi diversi di fornire gli acronimi (con i punti e senza punti ma con la pronuncia)?

Se si usa un acronimo che contiene i punti, la pronuncia delle varie lettere viene generata internamente. Se non si usano i punti, occorre fornire la pronuncia nell'apposito campo. Per alcuni acronimi, non è ovvio se utilizzare una pronuncia ortografica o una pronuncia simile a una parola. Ad esempio, NATO spesso è pronunciato 'n eɪ t oʊ' (nay-toh) e non 'ɛn eɪ ti oʊ' (N. A. T. O.). Per maggiori informazioni, visita la pagina Vocabolari personalizzati.

D: Dove posso trovare esempi di come utilizzare le pronunce personalizzate?

Puoi trovare formati di input di esempio ed esempi nella documentazione qui.

D: cosa succede se utilizzo un'IPA errata? Se non sono sicuro, è meglio che eviti di inserire l'IPA?

Il sistema utilizzerà la pronuncia fornita dall'utente; in tal modo aumentano le possibilità che la parola venga riconosciuta correttamente se la pronuncia è corretta e corrisponde a quanto è stato detto. Se non si è certi di poter generare l'IPA corretta, è consigliabile eseguire un confronto elaborando i propri file audio con un vocabolario che contenga le proprie pronunce IPA e con un vocabolario che contenga soltanto le parole (e, facoltativamente, i tipi di visualizzazione). Se non si fornisce alcuna pronuncia, il servizio utilizzerà un'approssimazione, che potrebbe o meno funzionare meglio di quanto è stato immesso.

D: quando si usano i moduli DisplayAs, posso visualizzare i set di caratteri che non hanno alcuna relazione con la lingua originale che si sta trascrivendo (ad esempio, output di "Street" come "街道")

Sì. Anche se le frasi possono utilizzare soltanto un set limitato di caratteri per la lingua specificata, i caratteri UTF-8 diversi da \t (TAB) sono consentiti nella colonna DisplayAs.

D: La redazione di contenuti automatici o di informazioni di identificazione personale (PII) è disponibile sia con le API in batch che per quelle in streaming per Transcribe?

Sì, Amazon Transcribe supporta la redazione di contenuti automatici o la redazione di PII sia per le API in batch che per quelle in streaming.

D: Quali sono le lingue supportate per la redazione di contenuti automatici / l'identificazione e la redazione di PII?

Consulta la documentazione di Amazon Transcribe per informazioni sulla disponibilità delle lingue per la redazione di contenuti automatici e di PII.

D: La redazione di contenuti automatici rivede anche le informazioni personali sensibili provenienti da fonti audio?

No, questa funzionalità non rimuove le informazioni personali sensibili da fonti audio. Tuttavia, Amazon Transcribe Call Analytics rimuove le informazioni personali sensibili sia dalle trascrizioni che dall'audio di origine. Visita questo link per maggiori dettagli su come l'analisi delle chiamate può redigere l'audio. Puoi rivedere le informazioni personali anche dall'audio sorgente utilizzando i timestamp di avvio e fine forniti nelle trascrizioni redatte per ogni istanza di un'enunciazione identificata su informazioni che consentono l'identificazione personale degli utenti. Fai riferimento alla soluzione di redazione audio per le API standard di Transcribe.

Tuttavia, le API di Amazon Transcribe Call Analytics rimuovono le informazioni personali sensibili sia dalle trascrizioni che dall'audio sorgente. Per maggiori informazioni, consulta la documentazione di redazione audio di Call Analytics.

D: Posso utilizzare la redazione di contenuti automatici per rivedere le informazioni personali da trascrizioni testuali esistenti?

No, la redazione di contenuti automatici funziona esclusivamente con audio come contenuti in entrata.

D: Cos'altro devo sapere prima di utilizzare la redazione di contenuti automatici?

La redazione di contenuti automatici è progettata per identificare ed eliminare le informazioni di identificazione personale (PII). Tuttavia, a causa della natura prevedibile del machine learning, potrebbe non identificare ed eliminare tutte le istanze di PII presenti in una trascrizione generata dal servizio. Ti consigliamo di rivedere gli output forniti dalla redazione di contenuti automatici per assicurarti che soddisfino le tue esigenze.

D: Ci sono differenze tra la redazione di contenuti automatici per le API in streaming e quelle in batch?

Sì, sono due le funzionalità aggiuntive supportate dalla redazione di contenuti automatici per la API in streaming che non sono supportate dall'API in batch. Puoi decidere di identificare soltanto, e non rivedere, le PII quando usi la redazione di contenuti con l'API in streaming. Con l'API in streaming puoi inoltre identificare o rivedere specifici tipi di PII. Per esempio, puoi rivedere solo il numero di sicurezza sociale e le informazioni della carta di credito e mantenere altre PII come nomi e indirizzi e-mail.

D: In quali regioni AWS sono disponibili la redazione di contenuti automatici o la redazione di PII?

Consulta la documentazione di Amazon Transcribe per informazioni sulla disponibilità della redazione di contenuti automatici e la redazione di PII per le API in batch e quelle in streaming nelle regioni AWS.

D: Quali API supportano l'identificazione automatica della lingua?

Al momento l'identificazione automatica della lingua è supportata dalle API in batch e in streaming.

D: Quali lingue può identificare automaticamente Amazon Transcribe?

Amazon Transcribe può identificare una qualsiasi delle lingue supportate dalle API in batch e in streaming. Consulta questa sezione per i dettagli delle lingue supportate e delle funzionalità specifiche della lingua.

D: Amazon Transcribe identifica più lingue nello stesso file audio?

Amazon Transcribe supporta ID multilingua per il batch. Per maggiori dettagli, consulta questo link.

D: Esiste un modo per limitare la lista delle lingue che possono essere scelte dall'identificazione automatica delle lingue?

Sì, puoi specificare un elenco di lingue che potrebbero essere presenti nella tua libreria multimediale. Quando fornisci un elenco delle lingue, la selezione della lingua identificata verrà effettuata da quell'elenco. Se non viene fornito un elenco delle lingue, il sistema elaborerà il file audio con tutte le lingue supportate da Amazon Transcribe e selezionerà la più probabile. L'accuratezza per l'identificazione della lingua migliora quando fornisci un elenco delle lingue, da cui poter scegliere. Per maggiori dettagli, consulta questo link.

Prezzi e disponibilità

D: Quanto costa?

Consulta la pagina dei prezzi di Amazon Transcribe per ulteriori informazioni.

D: In quali regioni AWS è disponibile Amazon Transcribe?

Consulta la tabella delle regioni per l'infrastruttura globale di AWS. Consulta questa sezione per maggiori dettagli sugli endpoint e le quote di Amazon Transcribe.

Privacy dei dati

D: In che modo AWS utilizza gli input vocali elaborati e salvati da Amazon Transcribe?

Amazon Transcribe può memorizzare e utilizzare gli input vocali elaborati dal servizio, esclusivamente per erogare e mantenere attivo il servizio, oltre a migliorare e sviluppare la qualità di Amazon Transcribe e di altre tecnologie di Machine Learning e Intelligenza Artificiale di Amazon. L'utilizzo dei contenuti è importante nell'ottica di miglioramento costante dell'esperienza utente di Amazon Transcribe, nonché per lo sviluppo e la formazione di tecnologie correlate. Amazon non utilizzerà eventuali informazioni che consentono l'identificazione personale, presenti nei tuoi contenuti, per creare prodotti, servizi o materiale di marketing mirati a te o ai tuoi utenti finali. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli scrupolosi e sofisticati, sia tecnici sia fisici (inclusa la crittografia su dati in transito e inattivi), progettati per impedire accessi non autorizzati e divulgazione di informazioni riservate e garantire che l'utilizzo dei contenuti da parte nostra sia conforme agli impegni presi nei tuoi confronti. Per ulteriori informazioni consulta la pagina https://aws.amazon.com/compliance/data-privacy-faq/. Puoi scegliere di non utilizzare i contenuti per migliorare e sviluppare la qualità di Amazon Transcribe e di altre tecnologie di machine learning e intelligenza artificiale di Amazon, utilizzando una policy di esclusione di AWS Organizations. Per ulteriori informazioni su come rifiutare esplicitamente, consulta la sezione Policy di esclusione dei servizi di IA.

D: Posso eliminare dati e artefatti associati ai lavori di trascrizione archiviati da Amazon Transcribe?

Sì. È possibile utilizzare la funzione Elimina API disponibile per eliminare dati e altri artefatti associati ai lavori di trascrizione. In caso di problemi durante l'operazione, contatta AWS Support.

D: Chi ha accesso ai contenuti elaborati e memorizzati da Amazon Transcribe?

Solo i dipendenti autorizzati potranno accedere ai contenuti elaborati da Amazon Transcribe. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli scrupolosi e sofisticati, sia tecnici sia fisici (inclusa la crittografia su dati in transito e inattivi), progettati per impedire accessi non autorizzati e divulgazione di informazioni riservate e garantire che l'utilizzo dei contenuti da parte nostra sia conforme agli impegni presi nei tuoi confronti. Per ulteriori informazioni consulta la pagina https://aws.amazon.com/compliance/data-privacy-faq/.

D: i contenuti elaborati e memorizzati da Amazon Transcribe rimangono di mia proprietà?

Manterrai la proprietà sui contenuti; Amazon li userà solo previo consenso.

D: Cosa succede ai miei dati utilizzati per formare modelli di linguaggio personalizzati? Saranno sempre di mia proprietà?

Quando invii dati di testo utilizzati per addestrare un modello dedicato, sei il proprietario sia dei dati di testo originali che di quelli del modello personalizzato generato. I dati di testo non verranno archiviati, né utilizzati per migliorare il nostro motore di riconoscimento vocale generale. I modelli prodotti utilizzando CLM sono autonomi e accessibili solamente dal cliente.

D: Visto che il servizio non manterrà i miei dati di formazione, esistono svantaggi o sono possibili riduzioni alla qualità della trascrizione o dell'esperienza generale con il servizio?

La trascrizione non subirà alcuna riduzione in termini di qualità a causa della mancata archiviazione dei dati da parte del servizio. Dopo aver utilizzato i dati di formazione per produrre un modello di linguaggio personalizzato, il modello sarà disponibile per l'utilizzo, a tua discrezione. Il set di formazione originale caricato viene eliminato dai nostri sistemi. L'unico svantaggio è dato dalla necessità di supporto tecnico. Poiché non manteniamo i dati di formazione originali, non abbiamo accesso a tali asset o ai relativi artefatti intermedi, se mai dovessi avere bisogno del team di supporto per indagare problematiche potenziali del servizio. Il supporto sarà comunque disponibile ma probabilmente non efficace fin da subito, poiché è probabile che avremo bisogno di chiederti informazioni aggiuntive.

D: Come posso riutilizzare i dati per miglioramenti o aggiornamenti futuri?

Poiché i dati di formazione non vengono archiviati, sarà necessario caricare di nuovo lo stesso set di dati o qualsiasi altro dato aggiuntivo per formare nuovi modelli. In presenza di un aggiornamento al modello di base fornito da Amazon Transcribe, ti arriverà una notifica. Per sfruttare il modello di base più recente, devi inviare i dati per formare un nuovo modello. Avrai quindi il modello personalizzato originale generato in precedenza e la nuova versione da utilizzare.

D: Come posso eliminare un modello?

Puoi eliminare qualsiasi modello linguistico del cliente che hai generato, a tua discrezione.

D: i contenuti elaborati da Amazon Transcribe vengono trasferiti all'esterno della regione AWS in cui è in uso il servizio?

I contenuti elaborati da Amazon Transcribe vengono crittografati e memorizzati su disco nella regione AWS in cui è in uso Amazon Transcribe. I contenuti elaborati da Amazon Transcribe possono essere parzialmente archiviati in un'altra regione AWS, esclusivamente con la finalità di un miglioramento costante e dello sviluppo della tua esperienza di cliente Amazon Transcribe e di altre tecnologie di Machine Learning e Intelligenza Artificiale di Amazon. Se scegli di non utilizzare i contenuti per migliorare e sviluppare la qualità di Amazon Transcribe e di altre tecnologie di Machine Learning e Intelligenza Artificiale di Amazon, i tuoi contenuti non verranno archiviati in un'altra regione AWS. Puoi richiedere l'eliminazione degli input vocali associati al tuo account, contattando AWS Support. La tua fiducia, la tua privacy e la sicurezza dei tuoi contenuti rappresentano la nostra massima priorità. Implementiamo controlli adeguati e sofisticati, a livello tecnico e fisico, tra cui la crittografia sia in condizioni statiche che durante i trasferimenti, per impedire gli accessi non autorizzati e la divulgazione dei contenuti e per garantire che l'utilizzo da parte nostra sia conforme ai nostri impegni nei tuoi confronti. Per ulteriori informazioni consulta la pagina https://aws.amazon.com/compliance/data-privacy-faq/.

D: è possibile utilizzare Amazon Transcribe in connessione con siti web, programmi o altre applicazioni rivolti o destinati a minori di 13 anni e soggette alle norme previste dal Children's Online Privacy Protection Act (COPPA)?

Sì; in conformità con i Termini del servizio di Amazon Transcribe, nonché adempiuto l'obbligo di fornire il necessario preavviso e ottenuto l'eventuale consenso dei genitori secondo quanto prescritto dal COPPA, sarà possibile utilizzare il servizio in connessione con siti web, programmi o altre applicazioni rivolti o destinati, del tutto o in parte, ai minori di 13 anni.

D: in che modo è possibile determinare se un sito web, un programma o un'applicazione sono soggetti al COPPA?

Per ottenere informazioni sui requisiti del COPPA e indicazioni per determinare se un sito Web, un programma o un'applicazione sono soggetti al COPPA, consulta direttamente le risorse fornite dalla Federal Trade Commission degli Stati Uniti. Il sito offre informazioni su come determinare se un servizio è rivolto o destinato, del tutto o in parte, ai minori di 13 anni.

Amazon Transcribe Call Analytics

D: Cos’è Amazon Transcribe Call Analytics?

Amazon Transcribe Call Analytics è un'API alimentata dall'IA che fornisce ricche trascrizioni di chiamate e informazioni dettagliate di conversazione utilizzabili che è possibile aggiungere alle applicazioni di chiamata per migliorare l'esperienza cliente e la produttività degli agenti. Combina potenti modelli di riconoscimento vocale e di elaborazione del linguaggio naturale (NLP) personalizzati che sono addestrati specificamente per comprendere le chiamate del servizio clienti e di vendita in uscita. Come parte delle soluzioni AWS Contact Center Intelligence (CCI), questa API è agnostica per i contact center e facilita ai clienti e ai produttori di software indipendenti l'aggiunta di funzionalità di analisi delle chiamate alle applicazioni.

D: Che cosa è possibile fare con Amazon Transcribe Call Analytics?

L'analisi delle chiamate di Amazon Transcribe può eseguire analisi in tempo reale e post-chiamata. Con l'analisi delle chiamate è possibile aggiungere rapidamente informazioni importanti come i punteggi delle emozioni dei clienti e degli agenti, i driver di chiamata, le categorie di chiamate direttamente come output API a qualsiasi applicazione per le chiamate in entrata o in uscita. I casi d'uso comuni includono l'assistenza degli agenti, gli avvisi del supervisore e l'analisi delle chiamate. Ecco due soluzioni esemplificative open source basate sull'analisi delle chiamate di Transcribe: Analisi delle chiamate in tempo reale con assistenza all'agente e Analisi post chiamate.

D: Come si inizia a usare Amazon Transcribe Call Analitycs?

È possibile utilizzare Transcribe Call Analytics attraverso le API e la Console di gestione AWS. I processi di analisi possono essere creati e monitorati attraverso l'API o la console. Nella console sarà visibile un elenco di processi di analisi e una pagina di dettagli del lavoro con parametri di input e un'anteprima dell'output JSON. Oltre a questo, sarà possibile creare e modificare le categorie attraverso le API o la console per la funzione di categorizzazione automatica dei contatti.

D: Quali lingue supporta Amazon Transcribe Call Analytics?

Consulta la documentazione di Amazon Transcribe per informazioni sulla disponibilità delle lingue per la redazione di contenuti automatici e di PII.

D: In quali regioni AWS è disponibile Amazon Transcribe Call Analytics?

Consulta la documentazione dei servizi regionali AWS per informazioni sulla copertura delle regioni AWS per l'analisi delle chiamate di Amazon Transcribe. Bisogna tenere a mente che il riepilogo generativo delle chiamate dell'analisi delle chiamate di Amazon Transcribe è disponibile come funzionalità di anteprima solo negli Stati Uniti orientali (Virginia settentrionale) e negli Stati Uniti occidentali (Oregon).

D: Il riepilogo generativo delle chiamate è disponibile con l'API dell'analisi delle chiamate di Transcribe sia post-chiamata che in tempo reale?

Attualmente, il riepilogo generativo delle chiamate è disponibile solo con l'API dell'analisi delle chiamate di Transcribe per l'analisi post-chiamata.

D: Come funzionano i prezzi per Amazon Transcribe Call Analytics?

L'API Amazon Transcribe Call Analytics ha un prezzo separato dalle API standard di Amazon Transcribe. Per ulteriori dettagli, consulta la pagina dei prezzi di Amazon Transcribe.

Amazon Transcribe Medical

D: Cos'è Amazon Transcribe Medical?

Amazon Transcribe Medical è un servizio di riconoscimento vocale automatico (ASR) che semplifica agli sviluppatori il compito di aggiungere capacità di sintesi vocale di contenuti medici alle proprie applicazioni. Usando Amazon Transcribe Medical, puoi trascrivere in modo rapido e accurato discorsi medici e conversazioni vocali e convertirli in testo per una varietà di scopi, come la registrazione delle note dei dottori o l'elaborazione nell'analisi del testo a valle per estrarre intuizioni significative.

D: D: Che cosa è possibile fare con Amazon Transcribe Medical?

Amazon Transcribe Medical utilizza modelli avanzati di machine learning per trascrivere accuratamente i discorsi medici in testo. Transcribe Medical può generare trascrizioni di testo che possono essere utilizzati per supportare una varietà di casi d'uso, spaziando dal flusso di lavoro della documentazione clinica e dal monitoraggio della sicurezza dei farmaci (farmacovigilanza) al sottotitolaggio per la telemedicina e persino l'analisi dei contact center nei settori sanitario e scientifico.

D: Per utilizzare Amazon Transcribe Medical è necessario essere un esperto di riconoscimento vocale automatico (ASR)?

No, non è necessaria alcuna competenza ASR o di machine learning per utilizzare Amazon Transcribe Medical. È solo necessario chiamare l'API di Transcribe Medical e il servizio gestirà il machine learning richiesto nel back-end per trascrivere il discorso medico in testo.

D: Come si inizia a usare Amazon Transcribe Medical?

Puoi iniziare a utilizzare Amazon Transcribe Medical dalla console di gestione AWS oppure dall’SDK. Fai riferimento a questa pagina della documentazione tecnica per ulteriori informazioni.

Amazon Transcribe Medical offre un piano gratuito che ti consente di provare il servizio. Consulta la pagina dei prezzi, per ulteriori informazioni.

D: Quali lingue supporta Amazon Transcribe Medical?

Amazon Transcribe Medical attualmente supporta la trascrizione medica in inglese (USA).

D: Quali specialità mediche supporta Amazon Transcribe Medical?

Amazon Transcribe Medical supporta la trascrizione di un gamma in continua espansione di aree di medicina generale e specialistica. Consulta la documentazione per un elenco completo delle specialità mediche supportate.

D: In quali regioni AWS è disponibile Amazon Transcribe Medical?

Consulta la documentazione dei servizi regionali AWS per informazioni sulla copertura delle regioni AWS per Amazon Transcribe Medical.

D: Qual è il prezzo di Amazon Transcribe Medical?

Per informazioni sui prezzi, consulta la pagina dei prezzi di Amazon Transcribe Medical.

D: Amazon Transcribe Medical è conforme alla normativa HIPAA?

Sì.

D: Il contenuto elaborato da Amazon Transcribe Medical viene utilizzato per uno scopo diverso dall’erogazione del servizio?

Amazon Transcribe Medical non utilizza il contenuto elaborato dal servizio per finalità differenti dall’erogazione e la gestione del servizio. I contenuti elaborati dal servizio non vengono utilizzati per sviluppare o migliorare la qualità di Amazon Transcribe Medical o di altre tecnologie di machine learning/intelligenza artificiale di Amazon.

D: Amazon Transcribe Medical apprende con il tempo?

Sì, Amazon Transcribe Medical usa il machine learning e viene continuamente addestrato per essere ottimizzato per i casi d'uso dei clienti. Amazon Transcribe Medical non archivia né usa i dati dei clienti utilizzati con il servizio per formare i modelli.

D: Cos’altro devo sapere prima di utilizzare il servizio Amazon Transcribe Medical?

Amazon Transcribe Medical non è un servizio che sostituisce il parere, la diagnosi o i trattamenti dei medici professionisti. Tu e i tuoi utenti finali siete responsabili di esercitare la vostra discrezione, l’esperienza e il giudizio per determinare la correttezza, la completezza, la puntualità e l’adeguatezza delle informazioni fornite da Amazon Transcribe Medical. Tu e i tuoi utenti finali siete gli unici responsabili di eventuali decisioni, consulenze, azioni e/o mancanza di azioni basate sull’utilizzo di Amazon Transcribe Medical. 

Amazon Transcribe Medical potrebbe non identificare con accuratezza le informazioni sanitarie in ogni circostanza e non soddisfa i requisiti per la de-identificazione delle informazioni sanitarie protette in conformità con HIPAA. Tu sei responsabile di esaminare i contenuti restituiti da Amazon Transcribe Medical per assicurarti che soddisfi le tue esigenze.

Modelli di linguaggio personalizzati

D: Quale funzionalità forniscono oggi i modelli di linguaggio personalizzati?

Puoi usare i modelli di linguaggio personalizzati per addestrare e sviluppare modelli di linguaggio specifici di un dato dominio. I modelli di linguaggio personalizzati (CLM, custom language models) attualmente supportano l'inglese (Australia), inglese (Gran Bretagna), hindi, inglese (Stati Uniti) e spagnolo (Stati Uniti) per trascrizioni di batch e inglese (Stati Uniti) per trascrizioni streaming. I modelli di linguaggio personalizzati supportano l'utilizzo simultaneo del vocabolario personalizzato per trascrizioni di batch.

D: Quanti e quali tipi di dati di formazione sono necessari? Come ottengo i dati? I dati devono essere in un formato specifico?

I dati di testo devono essere rilevanti per l'audio che verrà trascritto utilizzando il modello personalizzato, devono contenere il numero più alto possibile di parole specifiche del settore, frasi e combinazioni di parole. Raccomandiamo di utilizzare almeno 100.000 e massimo 10.000.000 parole di testo in esecuzione. Le risorse di dati di testo possono essere ottenute da qualsiasi origine pubblica o proprietaria (per esempio, il testo proveniente dai siti Web dei clienti). Raccomandiamo che ogni file di testo contenga almeno 200.000 parole, senza superare le dimensioni di 1 GB per file. Il testo deve essere in formato UTF-8 e utilizzare una frase per riga. Ogni frase deve contenere punteggiatura. Gli utenti sono responsabili della correttezza grammaticale, ortografica e la convalida del codice.

D: Come posso utilizzare i modelli di linguaggio personalizzati (CLM)?

Per addestrare un modello di linguaggio personalizzato i clienti possono semplicemente fornire i dati di testo in un bucket Amazon S3. Gli utenti possono utilizzare la console del servizio Amazon Transcribe per caricare ed elaborare i dati e formare un modello di linguaggio personalizzato. La formazione è totalmente automatizzate e richiede un intervento minimo da parte dell'utente. Quando il modello finale personalizzato è pronto, viene reso disponibile nell'account AWS del cliente per la trascrizione di file audio specifici di settore. Inoltre, i clienti possono formare più modelli personalizzati da utilizzare per una vasta gamma di casi d'uso.

D: I miglioramenti sono garantiti? Vale la pena spendere energie per la raccolta dei dati di testo?

I miglioramenti non sono garantiti: l'aumento delle prestazioni dipende dal grado di corrispondenza tra audio e dati di testo e sulla quantità di dati di forniti. Una maggiore quantità di dati normalmente fa la differenza ma, soprattutto, i dati devono contenere parole e sequenze di parole che saranno contenute anche dall'audio che si intende trascrivere. I miglioramenti alla precisione delle trascrizioni dipenderà dalla qualità dei dati di formazione e dal caso d'uso. In alcuni scenari, il valore di riferimento generale indica un aumento della precisione relativa dal 10 al 15%.

D: Quanto dura la formazione di un modello? Sarò in grado di utilizzarlo?

Per formare un modello ci vogliono normalmente tra le 6 e le 10 ore. La durata della formazione dipende dalla grandezza del set di dati. Il modello personalizzato sarà disponibile subito dopo il completamento della formazione.

D: In che modo potrò utilizzare il modello? Come posso capire se funziona meglio del modello generico fornito da Amazon Transcribe?

Il modello sarà disponibile nell'account con un ID modello da te assegnato prima del processo di addestramento. Per utilizzare il modello, la richiesta di trascrizione deve essere contrassegnata con il relativo ID. Dovresti testare il modello sui tuoi file audio e confrontare l'output con quello ottenuto dal motore generico.

D: Quanti modelli di linguaggio personalizzati posso addestrare? Posso avere più modelli abilitati simultaneamente nello stesso account?

Al momento, puoi formare fino a 5 modelli diversi per ogni account AWS. Per ogni account puoi archiviare fino a 10 modelli per impostazione predefinita. Il limite può essere aumentato qui se necessario.

D: Sono supportati i modelli acustici personalizzati?

No. I modelli acustici personalizzati non sono supportati. I modelli di linguaggio personalizzati vengono creati a partire da dati di testo inerenti al caso d'uso o dominio.

Ulteriori informazioni sui prezzi di Amazon Transcribe

Visita la pagina dei prezzi
Sei pronto per iniziare?
Prova la console di Amazon Transcribe
Hai altre domande?
Contattaci