Machine learning per applicazioni multimediali

Differenze tra il machine learning, l’intelligenza artificiale e il deep learning

Il termine ‘machine learning’ si riferisce all’uso di algoritmi di apprendimento che costruiscono un modello per comprendere le relazioni tra dati esistenti, così da generare previsioni su nuovi dati. Il termine ‘machine learning’ è spesso utilizzato in modo interscambiabile con ‘intelligenza artificiale’ (AI). Tuttavia, in realtà i due termini si riferiscono a concetti collegati, ma separati.

L’intelligenza artificiale è la capacità di percepire, imparare, ragionare, agire e adattarsi al mondo reale senza un processo di programmazione esplicito. In senso lato, il termine definisce qualsiasi sistema capace di mostrare un certo tipo di intelligenza simile a quella umana.

Dunque, se l’intelligenza artificiale è il concetto generale per indicare la realizzazione di soluzioni che permettono ai computer di imparare e prendere decisioni senza delle istruzioni esplicite da parte degli esseri umani, il machine learning è il metodo con cui gli sviluppatori ottengono tali abilità automatizzate.

Deep learning’ è il terzo termine spesso utilizzato quando si parla di machine learning. Piuttosto che utilizzare algoritmi matematici espliciti, il deep learning è il processo con cui si cerca di creare un modello di come il cervello funziona e apprende, ottenuto con sistemi chiamati reti neurali.

Conclusione: ci sono molti modi per costruire un sistema che dimostri di avere caratteristiche simili a quelle umane, con sistemi basati su regole e sistemi basati su conoscenze, ciascuno dei quali ha conosciuto il suo periodo di popolarità negli ultimi decenni. Ma il machine learning è profondamente radicato nella statistica e questo è il motivo per cui si utilizzano gli strumenti e i servizi di machine learning per costruire applicazioni e sistemi di intelligenza artificiale.

INTELLIGENZA ARTIFICIALE

Percepire, imparare, ragionare, agire e adattarsi al mondo reale senza un processo di programmazione esplicito.

MACHINE LEARNING

Metodi computazionali che utilizzano algoritmi matematici per costruire un modello ottenuto da dei dati (in modalità supervisionata, non supervisionata, semi-supervisionata o tramite apprendimento per rinforzo).

APPRENDIMENTO APPROFONDITO

Algoritmi ispirati dalle reti neurali con più strati di neuroni che apprendono in seguito a rappresentazioni complesse. 

Perché il machine learning sul cloud è differente?

La combinazione dell’enorme potenza di calcolo, dei data lake, della sicurezza, della capacità di analisi e la loro abilità di integrarsi con i servizi del cloud ha permesso al machine learning di uscire dalla nicchia di una tecnologia sperimentale per utilizzatori esperti e di diventare un blocco essenziale per il business.

Al giorno d’oggi, le aziende utilizzano gli strumenti di machine learning in quantità sempre maggiori per preparare i dati per l’analisi, costruire e rifinire i modelli di machine learning e sfruttare il vantaggio di applicazioni cognitive a beneficio degli utenti finali, le quali includono il riconoscimento vocale, l’analisi di immagini e video, la creazione di previsioni e suggerimenti e molte altre soluzioni intelligenti.

Come risultato, il machine learning permette di generare nuovi insight, scoperte ed efficienze a partire da sistemi, processi e tecnologie dell’informazione che fungono da motore per le operazioni di business di tutti i giorni. L’infrastruttura fondamentale sottostante a quasi qualsiasi tentativo aziendale o creativo può essere potenziata dalle tecnologie di machine learning in modi che aggiungono valore al prodotto del lavoro, agli individui e ai processi che interagiscono con esso.

Questo è maggiormente vero per i fornitori di video nel settore dei media e dell’intrattenimento, le aziende e il settore pubblico, ossia tutte le aree in cui il machine learning può aumentare il valore dei contenuti video e creare delle esperienze eccezionali per il pubblico.

In particolare, per i fornitori di video, le applicazioni per gli strumenti di machine learning sul cloud sono numerosissime e vengono continuamente sviluppate o rifinite.

Quali sono alcuni dei vantaggi del machine learning sul cloud per i video?

I fornitori di video di oggi si pongono molte domande simili:

  • Quali sono gli attori nella scena?
  • Quando certe parole vengono pronunciate?
  • Quali oggetti si trovano sullo schermo?
  • Una volta che conosciamo dell’esistenza di attori/scene/parole/oggetti, come possiamo recuperarli in modo preciso quando ne abbiamo bisogno?

Il machine learning sul cloud applicato ai video offre un modo conveniente per rispondere a ciascuna di queste domande. Ecco alcuni dei modi in cui ciò è possibile.

Archivi video ricercabili: con i servizi di machine learning sul cloud, i team video possono ridurre in modo sostanziale il tempo e le risorse impiegati in archiviazione, ricerca e costruzione degli asset dal loro archivio di video. L’indicizzazione dei contenuti e la creazione di metadati tramite l’utilizzo del machine learning possono permettere una serie di applicazioni diverse con vantaggi significativi nelle operazioni quotidiane.

Per esempio, molti fornitori di broadcast devono mantenere enormi archivi di contenuti video, spesso creati a partire da fonti disparate e utilizzando sistemi (se addirittura presenti) incoerenti per etichettare gli asset. Con gli strumenti di machine learning, è possibile eliminare i lunghi processi manuali necessari per etichettare i contenuti per le ricerche future e le librerie di contenuti video possono essere ottimizzate per ricerche veloci e accurate.

Didascalie video automatizzate: i metadati per le didascalie sono essenziali per rendere i video utili e accessibili a tutti i tipi di pubblico. Tuttavia, il processo per la trascrizione degli asset video e la produzione e l’integrazione di didascalie accurate nei vari formati richiedono di assicurare accessibilità attraverso schermi e dispositivi differenti, il che può essere un processo costoso e lento. Il tempo e i costi coinvolti diventano progressivamente proibitivi per progetti su vasta scala, quando è necessario generare le didascalie per grandi volumi di contenuti.

L’avvento degli strumenti di machine learning che possono elaborare e analizzare video sul cloud offrono ai fornitori di video un processo potente e scalabile per automatizzare il processo di creazione delle didascalie. Questo si traduce in un risparmio consistente in termini di tempo e forza lavoro necessari per le aziende (come per i fornitori di formazione online) che dispongono di ore di video per cui è necessario creare delle didascalie così da rispondere ai requisiti di accessibilità ai dati da parte dei rispettivi clienti.

Creazione di videoclip: nel passato, il processo per la creazione e la pubblicazione di videoclip richiedeva un flusso di lavoro manuale volto a identificare contenuti rilevanti da video grezzi, generare clip codificate in base al tempo e la transcodifica, la creazione di pacchetti e la distribuzione di tali clip per la pubblicazione sui canali sociali.

Tale processo high-touch, composto da più passaggi, può causare ritardi e risultare in opportunità mancate, soprattutto per i broadcast di eventi in diretta. Al giorno d’oggi, invece, gli strumenti di machine learning possono automatizzare i passaggi del processo per aiutare i fornitori di broadcast a ottenere clip di alto valore direttamente sugli schermi degli utenti quasi in tempo reale, il che è più indicato alla forte immediatezza tipica dei social media.

Personalizzazione e monetarizzazione: per ottimizzare le opportunità di profitto per i video in streaming, i fornitori di contenuti devono equipaggiare la propria infrastruttura per inserire annunci pubblicitari mirati e su misura per ciascun utente singolo, come attraverso le inserzioni pubblicitarie personalizzate.

Con dei carichi di lavoro di video potenziati dal machine learning, i fornitori di contenuti possono ora inserire perfettamente delle pubblicità personalizzate basate su diversi fattori, come il tipo di dispositivo utilizzato dall’utente, le informazioni demografiche sull’utente o persino le informazioni sul contenuto trasmesso (conosciute come “content-aware advertising insertion”).

Analisi e misurazioni: i flussi di lavoro per i video di oggi devono avere l’abilità di misurare e riportare delle quantità di informazioni pressoché infinite circa trasmissioni in diretta e VOD e l’infrastruttura che le supporta. I dati relativi alle prestazioni dei componenti singoli, i processi chiave e i flussi di lavoro completi possono essere misurati e utilizzati per notifiche in tempo reale e analisi a lungo termine.

Per identificare nuovi insight e scoperte, l’applicazione dei sistemi di machine learning offre ai fornitori di video nuovi modi per ottimizzare ciascun aspetto dei flussi di lavoro per i video, incluse le prestazioni dei flussi di lavoro stessi, l’utilizzo delle risorse di rete, i risultati relativi ai profitti e molto altro.

Quali sono alcune applicazioni di machine learning per i video possibili nel futuro?

Sicurezza: una delle preoccupazioni principali sulla sicurezza sul cloud è il controllo degli accessi. Per esempio, i fornitori di video hanno bisogno di prevenire i possibili errori dei dipendenti che potrebbero esporre accidentalmente dei contenuti privati, come le registrazioni di un blockbuster non ancora distribuito nei cinema. Una “guardia di sicurezza” automatica realizzata tramite il machine learning potrebbe proteggere contro tali problemi rilevando quando dei contenuti protetti sono in pericolo prima che chiunque altro se ne renda conto.

Diritti sui contenuti: un altro rompicapo per i fornitori di video è quando qualcuno pubblica dei video con dei contenuti coperti da copyright su internet con trucchetti che permettono di omettere i marchi commerciali o i filtri di contenuti (per esempio, rallentando la velocità dei frame a un frame al secondo). Immagina una soluzione di machine learning che disponga delle sceneggiature dello studio o i contenuti protetti da copyright al suo interno: con questi dati, la soluzione può scansionare il Web per rilevare i nuovi contenuti e riconoscere i dialoghi e l’audio che corrispondono alla sceneggiatura.

Dimostrazione video: Il machine learning nei video sportivi

Analisi basata sui frame: scopri come sia semplice identificare e tracciare le persone in una scena, creare ed esporre metadati dalla scena stessa e sfruttare i vantaggi dati dalle capacità di ricerca incredibilmente veloci e intelligenti in questa dimostrazione che unisce AWS Elemental Media Services e Amazon Rekognition.

Analisi basata sui frame per la dimostrazione video [3:41]

Inizia

Possiamo offrirti una consulenza dell'ufficio commerciale e del team di progettisti oppure puoi iniziare oggi stesso con un progetto pilota.