Exploiter la valeur des données non structurées : comment Coactive a créé une plateforme d'analyse visuelle sur AWS.

Comment a été ce contenu ?

Il est dit qu'une image vaut mille mots, et selon Forrester Research, une minute de vidéo peut valoir 1,8 million de mots. Pour les entreprises allant du commerce électronique aux réseaux sociaux, le contenu visuel vaut plus que la quantité de mots qu'il véhicule : c'est l'occasion de renforcer l'engagement des clients, d'accroître la confiance et la sécurité, d'améliorer la personnalisation et de recueillir des informations exploitables sur la base de l'engagement de contenu.

Coactive AI, une start-up d'analytique des données visuelles fondée par le PDG Cody Coleman et Will Gaviria Rojas en 2021, démocratise la possibilité pour les entreprises d'analyser les images et les vidéos. 

Les images et les vidéos sont des données non structurées, c'est-à-dire des informations qui n'ont pas encore été ordonnées d'une manière prédéfinie, dont l'analyse précise nécessite traditionnellement une expertise en machine learning, une infrastructure technique robuste et un temps considérable.

Coactive, la plateforme créée par Coactive AI sur Amazon Web Services (AWS) et disponible sur AWS Marketplace, aide les praticiens des données à obtenir rapidement des informations à partir de données non structurées, à grande échelle et avec un minimum de supervision. Accessibles par interface utilisateur ou API, les capacités de la plateforme vont de la recherche intelligente à l'analyse de production qui utilise toute la puissance de SQL. 

Démontrer ce que l'IA rend possible 

La solution innovante de Coactive est le fruit d'un travail intensif en termes de temps, de recherche et de détermination. En 2018, alors qu'il obtenait son doctorat en informatique à Stanford, Cody a reconnu que « l'intelligence artificielle et les applications intelligentes allaient être l'avenir. Le problème, c'est qu'il fallait des équipements d'une valeur de plusieurs centaines de milliers de dollars et d'énormes quantités de données pour accomplir quelque chose de significatif. » 

Gêné par ces limitations, Cody s'est engagé à réduire les obstacles limitant l'accès au machine learning afin que tout le monde puisse en bénéficier : « Ma mission pendant mes études supérieures était de mettre ma passion pour l'informatique au service de la société dans son ensemble, tout en servant de leader pour les générations futures. »  

Cody a rejoint le projet de recherche DAWN de Stanford, un groupe dont l'objectif est de faciliter considérablement la création d'applications basées sur l'IA. L'une des nombreuses percées impressionnantes issues du travail de Cody a été DAWNBench, la première référence de bout en bout des systèmes de machine learning (ML) utilisée par les entreprises technologiques mondiales comme norme de l'industrie. Au cours de sa première année, DAWNBench a permis de diviser par 500 le temps d'entraînement des modèles et par 20 le coût de l'entraînement. Galvanisé par les progrès réalisés dans la création d'une IA accessible, Cody s'est ensuite demandé ce qu'il restait à faire ensuite. 

Heureux hasard ou pure coïncidence, c'est à cette époque que Will, un ami de Cody, a déménagé dans la région de la baie de San Francisco pour entamer une carrière dans une grande entreprise de technologie. Leur amitié remonte à dix ans, depuis leurs années étudiantes au Massachusetts Institute of Technology (MIT), et Cody a aidé Will à emménager. « Will m'a posé les deux questions qu'il ne faut jamais poser à un doctorant, car elles déclenchent une crise existentielle immédiate, explique Cody en riant : Quand vas-tu obtenir ton diplôme ? et Que feras-tu après ça ? »

Cody avait envisagé plusieurs options : intégrer une entreprise technologique prestigieuse, devenir professeur d'université, rejoindre une start-up ou créer une entreprise. « Sans hésiter, Will m'a conseillé de créer ma propre entreprise, raconte Cody. Il m'a dit que c'était le bon moment, que j'avais les bonnes connaissances, et qu'il serait ravi de me rejoindre dans cette aventure. »

Après des mois de conversations, de recherches et d'étude directe du problème, Cody et Will sont arrivés à la même constatation : les personnes ont besoin d'une plateforme d'analyse visuelle pour exploiter la valeur de leur contenu, et il est temps de la créer. Cette décision a donné naissance à Coactive.

 Création d'une solution d'analyse visuelle pour tous

Le machine learning a progressé de manière significative pendant les années que Cody a passées à Stanford, mais il restait encore beaucoup à faire pour rendre les applications d'IA accessibles à tous, qu'il s'agisse des plus grandes entreprises du monde ou d'une start-up qui conçoit son produit minimum viable. 

Cela était particulièrement vrai à propos du machine learning qui analysait les images et les vidéos pour en tirer des informations exploitables. Pour ces formats de données non structurées, le flux de travail de bout en bout pouvait nécessiter un calcul de pointe à grande échelle au moyen de GPU, une capacité de stockage importante, ainsi qu'une grande quantité de temps et d'expertise en raison de la complexité du processus. Un flux de travail courant peut comprendre ce qui suit :

  1. Les scientifiques des données réalisent l'exploration des données et créent des modèles de vision par ordinateur pour analyser et comprendre les données visuelles.
  2. Les ingénieurs en ML rendent ces modèles opérationnels.
  3. Les ingénieurs logiciels intègrent les prédictions des modèles dans des applications réelles destinées aux consommateurs.

Pour rendre l'analyse de contenu visuel plus accessible, plus précise et plus efficace, Coactive associe l'étendue des grands modèles de langage (LLM) existants à la précision et à l'automatisation qui découlent de l'application d'un système d'apprentissage à des données spécifiques à un domaine. Une fois que les clients ont donné accès à leurs grands volumes de fichiers d'images et de vidéos brutes, Coactive utilise des modèles de base préentraînés en conjonction avec son système propriétaire d'apprentissage actif et de classification pour intégrer et indexer les données. Au cours de ce processus, les clients ont la possibilité de charger des étiquettes existantes ou de fournir quelques exemples afin que la plateforme Coactive puisse tirer davantage d'enseignements de toutes les nuances spécifiques au domaine de leurs données.

« L'un des principaux atouts des modèles de très grande taille réside dans le fait qu'il n'est pas nécessaire d'utiliser une quantité massive de données pour les affiner et les adapter à des tâches spécifiques, explique Cody. Ces grands modèles de langage ne sont pas appelés "few-shot learners" (apprenants avec peu d'exemples) pour rien : en ce qui concerne les données envoyées à ces systèmes, la qualité prime la quantité. »

Résultat : les clients peuvent utiliser Coactive pour interroger, rechercher, filtrer et analyser du contenu visuel rapidement et à grande échelle. 

Un partenariat avec AWS pour accélérer le succès

En tant que start-up innovante et à croissance rapide, Coactive a décidé de migrer de son fournisseur de cloud d'origine vers AWS. Les solutions proposées par AWS correspondent aux quatre principaux besoins de Coactive en matière de fournisseur de cloud : la profondeur et l'étendue des services, le caractère optionnel des outils, la disponibilité nécessaire à la mise à l'échelle de leur produit et les offres axées sur la sécurité. 

« Nous avions besoin de créer notre solution sur un fournisseur de cloud capable de gérer la taille de l'entreprise tout en étant suffisamment flexible pour nous permettre de créer quelque chose d'entièrement nouveau. Avec AWS, nous avons pu le faire tout en garantissant à nos clients la meilleure sécurité de sa catégorie », déclare Cody. 

Développer avec les solutions AWS

Après la migration, Coactive s'est attelée à la création d'une application Web de pointe en utilisant des solutions AWS telles qu'Amazon Simple Storage Service (Amazon S3), Amazon Aurora et Amazon Elastic Container Service (Amazon ECS). Cette application Web a permis à Coactive d'établir son MVP initial et de réaliser des démonstrations de faisabilité pour ses clients potentiels. 

Pour ses tâches de machine learning centrées sur les données, Coactive tire parti d'Amazon Aurora PostgreSQL sans serveur pour servir des demandes de base de données à faible latence sans avoir à consacrer du temps à la gestion de son infrastructure de base de données. Les nombreux pétaoctets de données d'images et de vidéos de Coactive sont stockés à l'aide d'Amazon S3. 

Pour présenter son application Web, Coactive utilise une combinaison d'Amazon CloudFront comme réseau de diffusion de contenu (CDN). L'application Web backend fonctionne sur Amazon ECS en communiquant avec leur base de données et des services périphériques en aval tels que Databricks sur AWS. Amazon ECS offre à Coactive la simplicité de gestion de l'infrastructure de conteneurs exécutée sur Amazon Elastic Compute Cloud (Amazon EC2). 

La sécurité et la confidentialité des données sont des aspects essentiels des charges de travail de machine learning. Pour offrir à ses clients une expérience d'analyse sécurisée, Coactive utilise notamment Amazon GuardDuty, Amazon Inspector et AWS Key Management Service. Grâce à ces solutions, Coactive a obtenu la conformité SOC2 en matière de cybersécurité en l'espace d'un seul trimestre.   

Commercialisation du produit

Il est important d'assurer la réussite de la mise sur le marché. Pour distribuer son produit aux clients AWS du monde entier, Coactive a rejoint le réseau de partenaires AWS (APN) et propose son produit sur AWS Marketplace. 

Coactive est également membre du programme AWS Global Startup (GSP), proposé par le biais de l'APN. Ce programme associe Coactive à un responsable développement partenaire AWS qui l'accompagne dans trois domaines clés : le développement de produits, la mise sur le marché et la co-vente.

Accélération de la réussite grâce à AWS Startups

En plus de développer avec l'aide des solutions techniques et de l'assistance commerciale d'AWS, Coactive s'appuie sur le programme AWS Activate, qui fournit aux start-ups des ressources allant de crédits et d'offres exclusives en passant par une assistance technique et des événements de réseautage. 

En collaboration avec l'équipe d'AWS Startups, Cody et d'autres membres d'AWS Activate ont récemment partagé leur expertise lors de l'AWS GenAI Day, un événement virtuel d'une journée qui présente la façon dont les start-ups développent avec l'IA générative sur AWS. Dans le cadre du débat principal « Cartographier la trajectoire de GenAI : de l'apprentissage à l'impact », Cody a expliqué pourquoi les données sont essentielles à l'IA générative et comment les récents progrès dans le domaine du machine learning ont le potentiel d'améliorer significativement la vie des personnes. 

Développer pour l'avenir

Coactive continue de développer un produit qui réduit les obstacles entravant l'accès au machine learning. Cody observe que prouver ce qui est possible, et aider d'autres personnes à le prouver également, est une partie importante de sa mission. Son histoire est incroyable : né pendant l'incarcération de sa mère, il a été placé dans une famille d'accueil avant d'être adopté par ses grands-parents qui l'ont élevé dans un contexte d'inégalité économique. En tant que premier doctorant noir diplômé de Stanford depuis près de 20 ans, Cody connaît bien les difficultés liées au fait d'appartenir à une minorité dans le domaine de la technologie. Il s'est engagé à faire de la diversité, de l'équité et de l'inclusion des principes fondamentaux de Coactive : « La façon dont nous réussissons est tout aussi importante que notre réussite. » 

« Je trouve que ce que dit Will est très beau : pour lui, son but dans la vie est de créer des échelles afin qu'il soit plus facile pour les autres de suivre ses traces, s'émerveille Cody. Ma mission dans la vie en général est de démontrer que peu importe d'où l'on vient, on peut réussir. Si j'ai pu le faire, tout le monde peut le faire. »

Pour ceux qui envisagent de fonder une start-up, Cody rappelle que la peur est une émotion habituelle, et que de s'inquiéter de savoir si l'on est fait ou non pour le rôle de PDG, des risques énormes liés à la création d'une entreprise, et de subir des difficultés pendant longtemps sont des inquiétudes normales. Il a commencé à prendre confiance en lui lorsqu'il a réalisé qu'il n'avait pas besoin d'avoir tout compris pour commencer, mais juste de commencer à tout comprendre.

Deux ans plus tard, le succès de ce conseil est évident : l'équipe de Coactive continue d'uniformiser les règles du jeu en matière d'IA en proposant à ses clients des analyses visuelles percutantes, et l'engagement de Cody à rendre les données utiles reste omniprésent. « L'un des cas d'utilisation les plus surprenants que j'ai vus est le réglage précis d'un modèle de reconnaissance vocale pour reconnaître les signes d'une affection respiratoire dangereuse dans les pleurs d'un bébé », s'étonne-t-il. La détection précoce grâce à l'IA a permis de réduire le taux de mortalité infantile et de diminuer le temps, le coût et les compétences nécessaires à l'établissement d'un diagnostic précis.

« L'IA durable et éthique a un potentiel incroyable pour améliorer de manière significative la vie des personnes, affirme Cody. L'une de mes plus grandes motivations à ce jour est qu'en démocratisant l'IA avec des entreprises comme Coactive et AWS, les personnes pourront raconter de nombreuses histoires et répondre à une foule de questions, et je suis impatient de voir tout cela. » 
Megan Crowley

Megan Crowley

Megan Crowley est rédactrice technique senior au sein de l'équipe chargée du contenu des startups AWS. Après avoir enseigné l'anglais dans un établissement d'enseignement secondaire, elle nourrit un enthousiasme sans faille à l'idée de contribuer à la création d'un contenu qui soit à la fois éducatif et inspirant. Partager les histoires des startups avec le monde entier est la partie la plus gratifiante de son poste chez AWS. Pendant son temps libre, Megan travaille le bois, fait du jardinage et visite les marchés d'antiquités.

Bonnie McClure

Bonnie McClure

Bonnie est une éditrice spécialisée dans la création de contenu accessible et engageant pour tous les publics et toutes les plateformes. Elle se consacre à fournir des conseils éditoriaux complets afin de fournir une expérience utilisateur fluide. En dehors de ses activités professionnelles, elle aime passer du temps avec ses deux grands chiens, s'exercer à la couture ou tester de nouvelles recettes en cuisine.

Comment a été ce contenu ?