Qu'est-ce que le machine learning ?

Le machine learning est la science du développement d'algorithmes et de modèles statistiques que les systèmes informatiques utilisent pour effectuer des tâches sans instructions explicites, en s'appuyant sur des modèles et des déductions. Les systèmes informatiques utilisent des algorithmes de machine learning pour traiter de grandes quantités de données historiques et identifier des modèles de données. Cela leur permet de prédire les résultats avec davantage de précision à partir d'un jeu de données d'entrée donné. Par exemple, les scientifiques des données pourraient entraîner une application médicale en vue de diagnostiquer le cancer à partir d'images radiographiques en stockant des millions d'images numérisées et les diagnostics correspondants.

Pourquoi le machine learning est-il important?

Le machine learning aide les entreprises en stimulant la croissance, en débloquant de nouvelles sources de revenus et en trouvant des solutions à des problèmes complexes. Les données sont le moteur essentiel de la prise de décision métier, mais traditionnellement, les entreprises utilisent des données provenant de diverses sources, comme les commentaires des clients, les employés et les finances. La recherche en machine learning automatise et optimise ce processus. Ainsi, en utilisant des logiciels qui analysent de très gros volumes de données à haut débit, les entreprises peuvent obtenir des résultats plus rapidement.

Où est utilisé le machine learning ?

Jetons un coup d'œil aux applications de machine learning dans certains secteurs clés :

Fabrication

Le machine learning peut soutenir la maintenance prédictive, le contrôle de la qualité et la recherche innovante dans le secteur de la fabrication. En outre,la technologie de machine learning aide également les entreprises à améliorer les solutions logistiques, notamment la gestion des ressources, de la chaîne d'approvisionnement et des stocks. Par exemple, le géant de la fabrication 3M utilise AWS Machine Learning pour innover dans le domaine du papier de verre. Les algorithmes de machine learning permettent aux chercheurs de 3M d'analyser comment de légers changements de forme, de taille et d'orientation améliorent l'abrasivité et la durabilité. Ces suggestions façonnent le processus de fabrication.

Santé et sciences de la vie

La prolifération des capteurs et de dispositifs portables a généré un volume important de données sur la santé. Les programmes de machine learning peuvent analyser ces informations et aider les médecins à établir un diagnostic et un traitement en temps réel. Les chercheurs en machine learning mettent au point des solutions qui permettent de détecter les tumeurs cancéreuses et de diagnostiquer les maladies oculaires, ce qui a un impact considérable sur la santé humaine. Par exemple, Cambia Health Solutions a eu recours à AWS Machine Learning pour soutenir les start-ups du secteur des soins de santé, qui ont pu automatiser et personnaliser le traitement des femmes enceintes.

Services financiers

Les projets de machine learning dans le domaine financier améliorent l'analytique des risques et la réglementation. La technologie de machine learning peut ainsi permettre aux investisseurs d'identifier de nouvelles opportunités en analysant les mouvements des marchés boursiers, en évaluant les fonds spéculatifs ou en calibrant les portefeuilles financiers. En outre, il peut aider à identifier les clients à haut risque et à atténuer les signes de fraude.  Le leader des logiciels financiers, Intuit, utilise le système AWS Machine Learning, Amazon Textract, pour créer une gestion financière plus personnalisée et aider les utilisateurs finaux à améliorer leur santé financière.

Vente au détail

Le secteur de la vente au détail peut utiliser le machine learning pour améliorer le service à la clientèle, la gestion des stocks, la vente incitative et le marketing entre canaux. Par exemple, Amazon Fulfillment (AFT) a réduit ses coûts d'infrastructure de l'ordre de 40 % en utilisant un modèle de machine learning pour identifier les stocks mal placés. Cela les aide à tenir la promesse d'Amazon qu'un article sera facilement disponible pour les clients et arrivera à temps, malgré le traitement de millions d'expéditions dans le monde chaque année.

Multimédia et divertissement

Les entreprises de divertissement se tournent vers le machine learning pour mieux comprendre leurs publics cible et proposer des contenus immersifs, personnalisés et à la demande. Les algorithmes de machine learning sont déployés pour aider à concevoir les bandes-annonces et autres publicités, proposer aux consommateurs des recommandations de contenu personnalisées, voire rationaliser la production. 

Par exemple, Disney utilise AWS Deep Learning pour archiver sa médiathèque. Les outils AWS Machine Learning étiquettent, décrivent et trient automatiquement le contenu multimédia, permettant ainsi aux scénaristes et animateurs de Disney de rechercher et de se familiariser rapidement avec les personnages de Disney.

Comment fonctionne le machine learning ?

L'idée fondamentale du machine learning est qu'il existe une relation mathématique entre toute combinaison de données d'entrée et de sortie. Le modèle de machine learning ne connaît pas cette relation à l'avance, mais il peut la deviner si on lui fournit suffisamment de jeux de données. Cela signifie que chaque algorithme de machine learning est construit autour d'une fonction mathématique modifiable. Le principe sous-jacent peut être compris comme suit :

  1. Nous « entraînons » l'algorithme en lui donnant les combinaisons d'entrée/sortie (i, o) suivantes : (2, 10), (5, 19) et (9, 31).
  2. L'algorithme calcule la relation entre l'entrée et la sortie comme suit : o=3*i+4.
  3. Nous lui donnons ensuite l'entrée 7 et lui demandons de prédire la sortie. Il peut déterminer automatiquement la sortie comme étant 25.

Bien qu'il s'agisse d'une compréhension de base, le machine learning se concentre sur le principe selon lequel tous les points de données complexes peuvent être mathématiquement reliés par des systèmes informatiques, à condition qu'ils disposent de suffisamment de données et de puissance de calcul pour traiter ces données. Par conséquent, la précision de la sortie est directement liée à l'ampleur de l'entrée donnée.

Quels sont les types d'algorithmes de machine learning ?

Les algorithmes peuvent être classés en quatre styles d'apprentissage distincts, en fonction de la sortie attendue et du type d'entrée.

  1. Machine learning supervisé
  2. Machine learning non supervisé
  3. Apprentissage semi-supervisé
  4. Machine learning de renforcement

1. Machine learning supervisé

Les scientifiques des données fournissent aux algorithmes des données d'entraînement labélisées et définies pour évaluer les corrélations. Les exemples de données spécifient à la fois l'entrée et la sortie de l'algorithme. Par exemple, les images de chiffres écrits à la main sont annotées pour indiquer à quel numéro elles correspondent. Un système d'apprentissage supervisé pourrait reconnaître les clusters de pixels et les formes associés à chaque nombre, à partir d'un nombre d'exemples suffisant. Il finira par reconnaître les chiffres écrits à la main, en distinguant de manière fiable les chiffres 9 et 4 ou 6 et 8. 

Les points forts de l'apprentissage supervisé résident dans sa simplicité et sa facilité de conception. Il est utile pour prédire un ensemble limité de résultats possibles, répartir des données en catégories ou combiner les résultats de deux autres algorithmes de machine learning. Cependant, l'étiquetage de millions de jeux de données non étiquetés relève du défi. Voyons cela plus en détail :

Qu'est-ce que l'étiquetage des données ?

L'étiquetage des données est le processus de catégorisation des données d'entrée à l'aide de leurs valeurs de sortie définies correspondantes. Des données de formation étiquetées sont nécessaires pour l'apprentissage supervisé. Par exemple, des millions d'images de pommes et de bananes devraient être labellisées avec les mots « pomme » ou « banane ». Les applications de machine learning pourraient alors utiliser ces données d'entraînement pour deviner le nom du fruit lorsqu'on leur donne une image de ce fruit. Cependant, l'étiquetage de millions de nouvelles données peut être une tâche longue et éprouvante. Les services de production participative, tels qu'Amazon Mechanical Turk, peuvent, dans une certaine mesure, surmonter cette limite des algorithmes d'apprentissage supervisé. Ces services permettent d'accéder à un vaste groupe de main-d'œuvre abordable réparti dans le monde entier, ce qui rend l'acquisition de données moins difficile.

2. Machine learning non supervisé

Les algorithmes d'apprentissage non supervisé s'entraînent sur des données non étiquetées. Ils parcourent les nouvelles données, en essayant d'établir des liens significatifs entre les entrées et les sorties prédéterminées. Ils peuvent repérer des modèles et catégoriser des données. Par exemple, des algorithmes non supervisés pourraient regrouper des articles d'actualité provenant de différents sites dans des catégories communes, comme le sport, les crimes, etc. Ils peuvent utiliser le traitement du langage naturel pour cerner le sens et l'émotion de l'article. Dans le secteur de la vente au détail, l'apprentissage non supervisé pourrait trouver des modèles dans les achats des clients et fournir des résultats d'analyse de données tels que : le client est plus susceptible d'acheter du pain s'il achète également du beurre.

L'apprentissage non supervisé est utile pour la reconnaissance des formes, la détection des anomalies et le regroupement automatique des données en catégories. Comme les données de formation ne nécessitent pas d'étiquetage, la configuration est simple. Ces algorithmes peuvent également être utilisés pour nettoyer et traiter automatiquement les données en vue d'une modélisation ultérieure. La limite de cette méthode est qu'elle ne peut pas fournir de prédictions précises. En outre, elle ne peut pas isoler des types spécifiques de résultats de données de manière indépendante.

3. Apprentissage semi-supervisé

Comme son nom l'indique, cette méthode combine l'entraînement supervisé et non supervisé. Cette technique repose sur l'utilisation d'une petite quantité de données étiquetées et d'une grande quantité de données non étiquetées pour entraîner les systèmes. Tout d'abord, les données étiquetées sont utilisées pour entraîner partiellement l'algorithme de machine learning. Ensuite, l'algorithme partiellement entraîné étiquette lui-même les données non étiquetées. Ce processus s'appelle le pseudo-étiquetage. Le modèle est ensuite entraîné à nouveau sur le mélange de données résultant sans être explicitement programmé.

L'avantage de cette méthode est que vous n'avez pas besoin de grandes quantités de données étiquetées. Elle est pratique lorsque l'on travaille avec des données telles que de longs documents qui prendraient trop de temps à être lus et étiquetés par des humains.

4. Apprentissage par renforcement

L'apprentissage par renforcement est une méthode selon laquelle des valeurs de récompense sont attachées aux différentes étapes que l'algorithme doit franchir. Le but du modèle est donc d'accumuler le plus de points de récompense possible pour ainsi atteindre un objectif final. Au cours de la dernière décennie, la plupart des applications pratiques de l'apprentissage par renforcement ont été réalisées dans le domaine des jeux vidéo. Des algorithmes d'apprentissage par renforcement à la pointe de la technologie ont obtenu des résultats impressionnants dans des jeux classiques et modernes, en battant bien souvent haut la main leurs homologues humains. 

Si cette méthode donne les meilleurs résultats dans les environnements de données incertains et complexes, elle est rarement mise en œuvre dans des contextes opérationnels. Elle n'est pas efficace pour les tâches bien définies, tandis que le biais du développeur peut également affecter les résultats. En effet, étant donné que le scientifique des données conçoit les récompenses, il peut influencer les résultats.

Les modèles de machine learning sont-ils déterministes ?

Si la sortie d'un système est prévisible, on dit qu'il est déterministe. La plupart des applications logicielles répondent de manière prévisible à l'action de l'utilisateur, on peut donc dire : « Si l'utilisateur fait ceci, il obtient cela ». Cependant, les algorithmes de machine learning apprennent par l'observation et l'expérience. Ils sont donc de nature probabiliste. L'instruction devient à présent : « Si l'utilisateur fait ceci, il y a X % de chances que cela se produise ».

Pour le machine learning, le déterminisme est une stratégie utilisée lors de l'application des méthodes d'apprentissage décrites ci-dessus. Toutes les méthodes de formation supervisées, non supervisées et autres peuvent être rendues déterministes selon les résultats souhaités par l'entreprise. La question de la recherche, l'extraction de données, la structure et les décisions de stockage influencent l'adoption ou non d'une stratégie déterministe ou non déterministe.

Approche déterministe ou probabiliste

L'approche déterministe se concentre sur la précision et la quantité de données collectées, de sorte que l'efficacité est privilégiée par rapport à l'incertitude. En revanche, le processus non déterministe (ou probabiliste) vise à gérer le facteur chance. Des outils intégrés aux algorithmes de machine learning permettent de quantifier, d'identifier et de mesurer l'incertitude pendant l'apprentissage et l'observation.

Qu'est-ce que le Deep Learning ?

Le deep learning est un type de technique de machine learning qui s'inspire du cerveau humain. En effet, les algorithmes de deep learning analysent les données avec une structure logique similaire à celle utilisée par les humains. Le deep learning utilise des systèmes intelligents appelés réseaux neuronaux artificiels pour traiter les informations par couches. Ainsi, les données circulent de la couche d'entrée à travers plusieurs couches de réseaux neuronaux cachés « profonds » avant d'arriver à la couche de sortie. Les couches cachées supplémentaires permettent un apprentissage bien plus performant que celui des modèles de machine learning standard.

Qu'est-ce qu'un réseau neuronal artificiel ?

Les couches de deep learning sont des nœuds de réseaux neuronaux artificiels (ANN) qui fonctionnent comme les neurones du cerveau humain. Les nœuds peuvent être une combinaison de matériel et de logiciel. Chaque couche d'un algorithme de deep learning est constituée de nœuds ANN. Chaque nœud, ou neurone artificiel, se connecte à un autre et est associé à un numéro de valeur et à un numéro de seuil. Lorsqu'il est activé,un nœud envoie son numéro de valeur comme entrée au nœud de la couche suivante. Il n'est activé que si sa sortie est supérieure à la valeur de seuil spécifiée. Sinon, aucune donnée n'est transmise.

Qu'est-ce que la reconnaissance d'image ?

La reconnaissance d'image est une application réelle de deep learning. Tout comme l'intelligence artificielle permet aux ordinateurs de penser, la reconnaissance d'image leur permet de voir, d'observer et de réagir. Les voitures à conduite autonome utilisent la reconnaissance d'image pour « lire » les panneaux de signalisation. La caméra d'une voiture prend une photo du panneau. Cette photo est alors envoyée à l'algorithme de deep learning de la voiture. La première couche cachée détecte les bords, la suivante différencie les couleurs, tandis que la troisième identifie les détails de l'alphabet sur le panneau. L'algorithme prévoit que le panneau indique STOP, et la voiture réagit alors en déclenchant le mécanisme de freinage.

Les concepts de machine learning et de deep learning sont-ils identiques ?

Le deep learning est un sous-ensemble du machine learning. Les algorithmes de deep learning peuvent être considérés à la fois comme une évolution sophistiquée et mathématiquement complexe des algorithmes de machine learning.

Les concepts de machine learning et d'intelligence artificielle sont-ils identiques ?

La réponse courte est non. Bien que les termes « machine learning » et « intelligence artificielle » (IA) puissent être utilisés de manière interchangeable, ils ne sont pas identiques. L'intelligence artificielle est un terme générique qui désigne différentes stratégies et techniques utilisées pour rendre les machines plus humaines. L'IA englobe tout, des assistants intelligents comme Alexa aux aspirateurs robotisés en passant par les voitures à conduite autonome. Le machine learning est l'une des nombreuses branches de l'intelligence artificielle. Si le machine learning relève de l'IA, toutes les activités d'IA ne peuvent pas être appelées machine learning.

Les concepts de machine learning et de science des données sont-ils identiques ?

Non, les concepts de machine learning et de science des données ne sont pas identiques. La science des données est un domaine d'étude qui a recours à une approche scientifique pour extraire du sens et des informations des données. Les scientifiques des données utilisent une gamme d'outils pour l'analyse des données, et le machine learning est l'un de ces outils. Les scientifiques des données comprennent l'image globale autour des données, comme le modèlecommercial, le domaine et la collecte des données, tandis que le machine learning est un processus informatique qui ne traite que des données brutes.

Quels sont les avantages et les inconvénients du machine learning ?

Examinons certaines choses que le machine learning peut et ne peut pas faire :

Avantages des modèles de machine learning :

  • Possibilité d'identifier les tendances et les modèles de données que les humains pourraient manquer.
  • Possibilité de fonctionner sans intervention humaine après la configuration. Par exemple, le machine learning dans les logiciels de cybersécurité peut surveiller et identifier en permanence les irrégularités dans le trafic réseau sans la moindre intervention de l'administrateur.
  • Les résultats peuvent devenir plus précis avec le temps.
  • Possibilité de traiter une variété de formats de données dans des environnements de données dynamiques, volumineux et complexes.

Désavantages des modèles de machine learning :

  • La formation initiale est un processus long et onéreux. Elle peut être difficile à mettre en œuvre si l'on ne dispose pas de données suffisantes.
  • Il s'agit d'un processus à forte intensité de calcul qui nécessite un investissement initial important si le matériel est installé en interne.
  • Il peut être difficile d'interpréter correctement les résultats et d'éliminer les incertitudes sans l'aide d'un expert.          

Comment le machine learning d'Amazon peut-il être utile ?

AWS rend le machine learning accessible à tous les développeurs, scientifiques des données et utilisateurs professionnels. Les services de machine learning d'Amazon fournissent une infrastructure performante, rentable et évolutive pour répondre aux besoins métier.

Vous venez de démarrer ?

Familiarisez-vous avec le machine learning grâce à nos dispositifs éducatifs pratiques comme AWS DeepRacer, AWS DeepComposer et AWS DeepLens.

Vous disposez déjà d'un archivage de données ?

Utilisez l'étiquetage des données Amazon SageMaker pour les flux de travail d'étiquetage des données intégrés qui prennent en charge les vidéos, les images et le texte.

Vous disposez déjà de systèmes de machine learning ?

Utilisez Amazon SageMaker Clarify pour détecter les biais et Amazon SageMaker Debugger pour surveiller et optimiser les performances.

Vous souhaitez mettre en œuvre le deep learning ?

Utilisez l'entraînement distribué Amazon SageMaker pour entraîner automatiquement de grands modèles de deep learning. Inscrivez-vous pour créer un compte gratuit et commencer votre transition vers le machine learning dès aujourd'hui !

Machine learning : étapes suivantes