Sfruttare il valore dei dati non strutturati: come Coactive ha sviluppato una piattaforma di analisi visiva su AWS

Com'era questo contenuto?

Si dice che un'immagine valga più di mille parole e, secondo Forrester Research, un minuto di video potrebbe valere 1,8 milioni di parole. Per le aziende di settori che vanno dall'e-commerce ai social media, i contenuti visivi valgono più della quantità di parole che trasmettono: rappresentano un'opportunità di sviluppare il coinvolgimento dei clienti, aumentare la fiducia e la sicurezza, migliorare la personalizzazione e ottenere informazioni concrete sul coinvolgimento generato dai contenuti.

Coactive AI, una startup di analisi dei dati visivi fondata dal CEO Cody Coleman e da Will Gaviria Rojas nel 2021, sta democratizzando le opportunità di analisi di immagini e video offerte alle aziende. 

Immagini e video sono dati non strutturati, ovvero informazioni che non sono ancora state ordinate in modo predefinito, che tradizionalmente richiedono competenze di machine learning, una solida infrastruttura tecnica e una quantità di tempo significativa per essere analizzati accuratamente.

Coactive, la piattaforma sviluppata da Coactive AI su Amazon Web Services (AWS) e disponibile nel Marketplace AWS, aiuta i professionisti dei dati a ricavare rapidamente informazioni dettagliate da dati non strutturati su larga scala e con supervisione minima. Le capacità della piattaforma, accessibili tramite interfaccia utente o API, spaziano dalla ricerca intelligente all’analisi della produzione che sfruttano la piena potenza di SQL. 

Dimostrare cosa è possibile fare con l'IA 

La soluzione innovativa di Coactive è il risultato di un uso intensivo di tempo, ricerche e determinazione. Nel 2018, mentre conseguiva il PhD in Computer Science a Stanford, Cody si è reso conto del fatto che "l'intelligenza artificiale e le applicazioni intelligenti sarebbero state il futuro. L'ostacolo principale era la necessità di centinaia di migliaia di dollari di apparecchiature e di enormi quantità di dati per poter realizzare qualcosa di significativo." 

Infastidito da queste limitazioni, Cody si è impegnato a ridurre gli ostacoli all'accesso al machine learning, in modo che tutti potessero trarne beneficio. "La mia missione durante la scuola di specializzazione è stata utilizzare la mia passione per l'informatica a vantaggio della società in generale e diventare un leader per le generazioni future".  

Cody è entrato a far parte del progetto di ricerca DAWN di Stanford, un gruppo dedicato alla semplificazione dello sviluppo di applicazioni basate sull'IA. Uno dei tanti straordinari successi del lavoro di Cody è stato DAWNBench, il primo benchmark per sistemi di machine learning (ML) end-to-end utilizzato da aziende tecnologiche di tutto il mondo come standard di settore. Nel primo anno, DAWNBench ha ridotto il tempo di addestramento dei modelli di 500 volte e i costi di 20 volte. Stimolato dai progressi fatti nella creazione di un'IA accessibile, Cody ha dovuto affrontare la grande domanda successiva: cosa fare dopo? 

Forse è stata una fortunata casualità o una coincidenza, in quel periodo Will, un amico di Cody, si è trasferito nella Bay Area di San Francisco per iniziare la sua carriera in una grande azienda tecnologica. Vista la loro amicizia più che decennale, iniziata all'epoca del loro corso di laurea al Massachusetts Institute of Technology (MIT), Cody ha aiutato Will a traslocare. "Will mi ha rivolto le due domande che non si dovrebbero mai fare a un dottorando perché scatenano un’istantanea crisi esistenziale," dice Cody ridendo. "'Quando finirai il PhD?' e 'Cosa farai dopo?'"

Cody aveva preso in considerazione diverse opzioni, dall'entrare in una prestigiosa azienda tecnologica al diventare un professore universitario, all'entrare in una startup e all'avviare un'azienda propria. "Senza esitazione, Will mi ha detto di costituire la mia azienda", dice Cody. "Mi ha detto che era il momento giusto e che avevo le competenze giuste. E che gli avrebbe fatto piacere accompagnarmi in questo percorso".

Dopo mesi di intense conversazioni, ricerche e studio del problema in prima persona, Cody e Will sono giunti alla stessa conclusione: alle persone serve una piattaforma di analisi visiva per sbloccare il valore dei propri contenuti ed era ora di svilupparla. Coactive è stata fondata sulla base di quella decisione.

 Creare una soluzione di analisi visiva per tutti

Il machine learning ha compiuto notevoli progressi nel lasso di tempo in cui Cody era studente a Stanford, ma c'era ancora molto lavoro da fare per rendere le applicazioni IA accessibili a tutti, dalle aziende più grandi del mondo alle startup che sviluppano il proprio prodotto minimo funzionante. 

Ciò valeva in particolare per il machine learning che analizza immagini e video per ricavarne informazioni concrete. Per questi formati di dati non strutturati, il flusso di lavoro end-to-end poteva richiedere capacità di calcolo di alta gamma su larga scala sotto forma di GPU, una capacità di archiviazione significativa e grandi quantità di tempo e competenze per via della complessità del processo. Un flusso di lavoro comune può includere i seguenti componenti:

  1. Data scientist che completano l'esplorazione dei dati e sviluppano modelli di visione artificiale per analizzare e comprendere i dati visivi.
  2. Ingegneri ML che rendono operativi questi modelli.
  3. Ingegneri software che integrano le previsioni dei modelli in applicazioni reali per i consumatori.

Per rendere l'analisi dei contenuti visivi più accessibile, accurata ed efficiente, Coactive abbina la gamma di modelli linguistici di grandi dimensioni (LLM) esistenti all'accuratezza e all'automazione che derivano dall'applicazione di un sistema di apprendimento a dati specifici del dominio. Dopo che i clienti hanno fornito l'accesso a grandi volumi di file di immagini e video non elaborati, Coactive utilizza modelli di base pre-addestrati insieme al sistema proprietario di apprendimento attivo e classificazione per incorporare e indicizzare i dati. Durante questo processo, i clienti hanno la possibilità di caricare etichette esistenti o di fornire qualche esempio affinché la piattaforma Coactive possa apprendere ulteriori sfumature specifiche del dominio relative ai dati.

"Uno degli aspetti più potenti dei modelli di grandi dimensioni è che non è necessario utilizzare enormi quantità di dati per ottimizzarli per attività specifiche," spiega Cody. "Questi modelli linguistici di grandi dimensioni vengono chiamati 'few-shot learner' per un motivo preciso. La cosa davvero importante non è la quantità di dati inseriti in questi sistemi, ma la qualità".

Il risultato? I clienti possono utilizzare Coactive per inviare query, fare ricerche e analizzare contenuti visivi in modo rapido e su vasta scala. 

Collaborazione con AWS per accelerare il successo

In qualità di startup innovativa e in rapida crescita, Coactive ha deciso di migrare dal proprio provider cloud originale e passare interamente ad AWS. Le soluzioni offerte da AWS sono in linea con le quattro caratteristiche principali che Coactive ricerca in un provider cloud: profondità e ampiezza dei servizi, diverse opzioni presenti negli strumenti, disponibilità per alimentare la scalabilità del prodotto e offerte che mettano la sicurezza al primo posto. 

"Dovevamo sviluppare la nostra soluzione in un provider cloud che potesse gestire un servizio su scala aziendale pur offrendo una flessibilità sufficiente per consentirci di creare qualcosa di completamente nuovo. Con AWS, siamo riusciti a fare tutto ciò garantendo al contempo una sicurezza di altissima qualità ai nostri clienti," afferma Cody. 

Sviluppare con le soluzioni AWS

Dopo la migrazione, Coactive si è messa all’opera per sviluppare un'applicazione web all'avanguardia utilizzando soluzioni AWS come Amazon Simple Storage Service (Amazon S3), Amazon Aurora e Amazon Elastic Container Service (Amazon ECS). Questa applicazione web ha aiutato Coactive a istituire il prodotto minimo funzionante (MVP) iniziale e a eseguire i proof-of-concept per potenziali clienti. 

Per le operazioni di machine learning incentrate sui dati, Coactive trae vantaggio dall'utilizzo di Amazon Aurora PostgreSQL Serverless per servire richieste al database a bassa latenza senza dover dedicare tempo alla gestione dell'infrastruttura del database. I diversi petabyte di dati immagini e video di Coactive sono archiviati utilizzando Amazon S3. 

Per il front-end dell'applicazione web, Coactive utilizza una combinazione di Amazon CloudFront come rete di distribuzione di contenuti (CDN). Il back-end dell'applicazione web viene eseguito su Amazon ECS, in comunicazione con il database di Coactive e servizi downstream periferici come Databricks su AWS. Amazon ECS garantisce a Coactive una gestione semplice dell'infrastruttura dei container in esecuzione su Amazon Elastic Compute Cloud (Amazon EC2). 

La sicurezza e la privacy dei dati sono aspetti fondamentali dei carichi di lavoro di machine learning. Per offrire ai propri clienti un'esperienza di analisi dei dati sicura, Coactive utilizza Amazon GuardDuty, Amazon Inspector, il Sistema AWS di gestione delle chiavi e altri servizi. Con queste soluzioni, Coactive ha ottenuto la conformità allo standard SOC2 di sicurezza informatica nel corso di un solo trimestre. 

Portare il prodotto sul mercato

È importante assicurare il successo del piano commerciale di go-to-market. Per distribuire il proprio prodotto al pubblico globale di clienti AWS, Coactive è entrata a far parte della Rete dei partner AWS (APN) e ha pubblicato la propria soluzione sul Marketplace AWS. 

Coactive è anche diventata membro del programma AWS Global Startup, offerto tramite la rete dei partner. Questo programma abbina Coactive con un Partner Development Manager AWS che fornisce supporto in tre aree fondamentali: sviluppo del prodotto, piano commerciale di go-to-market e vendita congiunta.

Una spinta verso il successo con Startup AWS

Oltre allo sviluppo realizzato con l'aiuto delle soluzioni tecniche e del supporto aziendale di AWS, Coactive sfrutta il programma AWS Activate, che fornisce alle startup diverse risorse, da crediti e offerte esclusive a supporto tecnico ed eventi di networking. 

In collaborazione con il team di Startup AWS, Cody e altri membri di AWS Activate hanno recentemente condiviso le proprie competenze durante l'AWS GenAI Day, un evento virtuale di un giorno che illustra come le startup stanno sviluppando soluzioni di IA generativa su AWS. Durante il keynote panel "Mappatura della traiettoria dell'IA generativa: dall'apprendimento al suo impatto", Cody ha spiegato il motivo per cui i dati sono una componente fondamentale dell'IA generativa e come le recenti innovazioni di machine learning possono migliorare la vita delle persone in modo significativo. 

Il futuro a un passo

Coactive continua a sviluppare un prodotto che riduce gli ostacoli di accesso al machine learning e Cody sottolinea che dimostrare cos'è possibile fare, e aiutare altre persone a farlo, è una parte importante della sua missione. La sua storia incredibile parte dalla nascita durante la detenzione della madre, passando per l'affidamento e l'adozione da parte dei nonni che l'hanno cresciuto facendo i conti con la disuguaglianza economica. In qualità di primo dottorando nero a conseguire il PhD a Stanford in più di 20 anni, Cody conosce bene le difficoltà che comporta essere una persona insufficientemente rappresentata nel settore tecnologico. È deciso a impegnarsi per rendere la diversità, l'equità e l'inclusione principi fondamentali di Coactive. "Il modo in cui si raggiunge il successo è importante quanto il successo stesso," afferma Cody. 

"Will ha una bellissima espressione: dice che il suo obiettivo nella vita è costruire scale, affinché sia più facile per gli altri seguire i suoi passi," spiega Cody. "La mia missione nella vita in generale è dimostrare che puoi avere successo a prescindere da dove vieni. Se ce l'ho fatta io, può farcela chiunque."

Rivolgendosi a chi sta pensando di fondare una startup, Cody rivela che è normale avere paura: paura di non avere la stoffa per il ruolo di CEO, del fatto che avviare un'azienda è un grosso rischio, di dover affrontare una situazione difficile per un lungo periodo. Il momento in cui ha iniziato a crederci è arrivato quando si è reso conto del fatto che "non devo aver già una soluzione per tutto per iniziare. Devo solo iniziare a trovare le soluzioni".

Due anni dopo, il successo di questo consiglio è palese. Il team di Coactive continua a uniformare il settore dell'IA offrendo analisi visive di grande impatto ai propri clienti. L'impegno di Cody per rendere utili i dati rimane determinato. "Uno dei casi d'uso più incredibili che abbia visto è l'ottimizzazione di un modello di riconoscimento vocale per la rilevazione di una pericolosa patologia respiratoria nel pianto dei bambini," spiega. La rilevazione precoce dei sintomi grazie all'IA ha ridotto il tasso di mortalità infantile e diminuito il tempo, i costi e le competenze necessarie per fare una diagnosi accurata.

"L'IA sostenibile ed etica ha un potenziale incredibile per migliorare significativamente le vite delle persone", dice Cody. "Una delle mie principali motivazioni tutt'ora è che, democratizzando grazie ad aziende come Coactive e AWS, ci sono tantissime storie che potranno essere raccontate e domande che potranno trovare risposta. Non vedo l’ora di scoprire quali saranno". 
Megan Crowley

Megan Crowley

Megan Crowley è Senior Technical Writer del team Startup Content di AWS. Dopo aver insegnato inglese al liceo in una fase precedente della sua carriera, attualmente è spinta da un entusiasmo inesauribile nel contribuire a creare contenuti educativi e ispiratori. Condividere le storie delle startup con il resto del mondo rappresenta la parte più gratificante del suo ruolo in AWS. Nel tempo libero, Megan adora lavorare il legno, dedicarsi al giardinaggio e andare alla scoperta di mercatini dell'antiquariato.

Bonnie McClure

Bonnie McClure

Bonnie è una redattrice specializzata nella creazione di contenuti accessibili e coinvolgenti per ogni tipo di pubblico e piattaforma. Il suo impegno è rivolto a fornire una guida editoriale completa per garantire un'esperienza utente ottimizzata. Quando non è impegnata a difendere la virgola di Oxford, ama trascorrere del tempo con i suoi due grandi cani, praticare le sue abilità di cucito o sperimentare nuove ricette in cucina.

Com'era questo contenuto?