Le Réseau ferroviaire français réduit ses coûts et augmente sa productivité grâce au système AWS
2021
La Société Nationale des Chemins de Fer Français (SNCF), le, service ferroviaire public français, a besoin d'une technologie sophistiquée pour gérer et maintenir la sécurité sur son réseau ferroviaire de 32 000 km. En 2017 SNCF Réseau, la filiale qui entretient et gère l'infrastructure ferroviaire de la SNCF, a cherché à créer une solution de reconnaissance d'image qui pourrait utiliser les images capturées par les caméras des trains pour aider l'entreprise à identifier les dysfonctionnements potentiels des rails et à anticiper les besoins de maintenance. Cependant, les anciens centres de données de SNCF Réseau n'offraient pas l'agilité et le débit recherchés par l'entreprise et devenaient obsolètes et coûteux à entretenir. Bien que SNCF Réseau avait accès à une grande quantité de données, celles-ci étaient en grande partie isolés et ne se prêtaient pas à l'analyse nécessaire pour faciliter la solution d'apprentissage automatique (ML) que l'entreprise envisageait.
Souhaitant moderniser son infrastructure technologique, SNCF Réseau a fait appel à Olexya, un partenaire-conseil privilégié d'Amazon Web Services (AWS), pour effectuer la migration des applications vers AWS. La vaste migration a consisté à transférer le cadre ML de SNCF Réseau vers Amazon SageMaker, le service entièrement géré qui aide les scientifiques des données et les développeurs à préparer, créer, entraîner et déployer rapidement des modèles ML de haute qualité en rassemblant un large éventail de fonctionnalités conçues spécialement pour le ML. Sur AWS, l'équipe a finalement réduit le temps d'entraînement du modèle de 3 jours à 10 heures. Maintenant dans le cloud, SNCF Réseau est prêt à réaliser une maintenance prédictive basée sur ML et les données intelligentes et à libérer le potentiel du ML pour de nombreux autres projets dans toute l'entreprise.
Amazon SageMaker et les instances Spot ont contribué à simplifier et à accélérer le déploiement des algorithmes d'IA/ML. »
Samuel Descroix
directeur des données géographiques et d'analyse
SNCF Réseau
Modernisation et standardisation dans le cloud
SNCF Réseau est le résultat de la réunification en 2015 du Réseau Ferré de France et de la SNCF qui utilisaient des systèmes d'information distincts jusqu'en 2015. Après la réunification, un manque de standardisation a entravé les échanges avec les responsables dans les pays voisins. Dédié à la maintenance, à la modernisation et à la sécurité, SNCF Réseau cherche depuis longtemps à standardiser les données et à maximiser leur utilité au sein de l'entreprise et pour ses partenaires européens. L'entreprise a donc décidé de remanier une grande partie de son infrastructure héritée sur AWS, à partir de 2019. SNCF Réseau a déterminé que l'étendue des AWS Managed Services répondait aux attentes de l'entreprise pour accélérer la mise en œuvre de sa stratégie Smart Data, une approche radicalement nouvelle de la collecte et de l'analyse rapide des données pertinentes pour l'entretien des rails SNCF à l'aide de capteurs intelligents en temps quasi réel.
L'une des premières étapes a consisté à migrer les données vers un lac de données dans Amazon Simple Storage Service (Amazon S3), un service de stockage d'objets qui offre une capacité de mise à l'échelle, une disponibilité des données, une sécurité et des performances de pointe. Soucieuse d'éviter les problèmes liés à la ségrégation des données et aux définitions non standard, la société a développé Ariane Model, un langage de modélisation unifié, afin d'aligner les définitions des rails, du trafic, de la maintenance et d'autres éléments clés, normalisant ainsi les données après leur collecte. Basé sur RailTopoModel, un modèle systémique utilisé par plusieurs organisations européennes, Ariane a représenté une étape importante vers la normalisation régionale et la production de rapports sur la réglementation et la conformité.
Des définitions claires et standard ont aidé SNCF Réseau à créer un lac de données « propre » dans Amazon S3. Au lieu de déverser des données brutes dans un lac de données et d'appliquer une couche d'intelligence pour leur donner un sens, l'entreprise a développé les moyens de définir des objets pertinents pour des cas d'utilisation particuliers, y compris ML, avant de les placer dans le lac de données. « "Contrairement à un marécage de données, un lac de données propre apporte le niveau de confiance dans les données dont les responsables ont besoin pour formuler une stratégie et prendre les bonnes décisions », explique Samuel Descroix, responsable du département des données géographiques et d'analyse de SNCF Réseau. Ainsi, les scientifiques des données peuvent interroger les données à l'aide d'Amazon Athena, un service de requête interactif qui facilite l'analyse des données dans Amazon S3 en utilisant un langage de recherche structurée standard.
Rationalisation de ML sur AWS tout en réduisant les coûts
Un élément essentiel de la modernisation de SNCF Réseau est son modèle de reconnaissance d'image qui identifie les dysfonctionnements ou les problèmes sur les lignes ferroviaires et permet de mieux anticiper les besoins de maintenance. En 2017, l'entreprise avait commencé à développer des algorithmes d'intelligence artificielle (IA)/ML en Python 2.7 avec le cadre d'apprentissage profond Caffe2, mais ses centres de données sur site n'avaient pas l'agilité et le débit nécessaires pour permettre un ML efficace, l'entraînement prenant jusqu'à 3 jours. Après avoir effectué la migration vers AWS et établi un lac de données propre dans Amazon S3, l'entreprise a vu l'occasion de tirer parti de la suite de services sur AWS en adaptant son cadre Caffe2 pour qu'il soit entraîné et déployé à partir des environnements gérés par AWS, y compris Amazon SageMaker.
En mars 2020, l'entreprise a déployé le code sur son nouveau système sur AWS après seulement 2 semaines de mise au point. Avec son cadre désormais sur AWS, les scientifiques des données de SNCF Réseau bénéficient d'un haut degré d'autonomie pour les cas d'utilisation ML, avec un accès aux outils adaptés aux bons moments. « "De nombreuses tâches qui étaient complexes pour les scientifiques des données sont grandement simplifiées sur Amazon SageMaker », se félicite M. Descroix. Grâce à cette relative simplicité, les tâches d'entraînement sont passées de 3 jours avec l'ancien système à seulement 10 heures avec le nouveau, soit une réduction de près de 90 %.
De plus, l'entreprise a également pu optimiser ses coûts en utilisant des instances Spot Amazon Elastic Compute Cloud (Amazon EC2), ce qui permet à SNCF Réseau de profiter de la capacité inutilisée d'Amazon EC2 sur AWS à un prix très réduit. Étant donné que les applications ML font considérablement appel au calcul, l'utilisation d'instances Spot via l'entraînement Spot géré dans Amazon SageMaker s'est avérée précieuse, permettant finalement à l'équipe d'économiser 71 % des coûts de science des données par rapport aux instances à la demande Amazon EC2. « "Amazon SageMaker et les instances Spot ont joué un rôle déterminant dans la simplification et l'accélération du déploiement des algorithmes d'IA/ML », souligne M. Descroix.
Olexya a accompagné SNCF Réseau dans la mise en place d'une équipe DevOps pour le déploiement AWS, permettant de réduire les délais de livraison du projet de 3 mois avec l'ancien système à moins de 48 heures sur le nouveau système. Des travaux sont en cours afin de réduire encore ces délais et d'automatiser complètement le déploiement sans interactions humaines. Un élément clé de ces travaux est Amazon Elastic Kubernetes Service (Amazon EKS) qui permet aux utilisateurs de fournir des clusters hautement disponibles et sécurisés et automatise les tâches clés telles que les correctifs, l'approvisionnement des nœuds et les mises à jour. Un autre avantage important de l'utilisation d'AWS est le délai de mise en place de l'infrastructure, y compris la mise en route de modèles entraînés avec des données avec les ressources nécessaires, qui est passé de 3 à 6 mois à une semaine seulement.
Augmentation du potentiel ML dans toute l'entreprise
Depuis janvier 2021, SNCF Réseau optimise son algorithme de maintenance prédictive pour la production et détermine le matériel approprié pour ses autocars. Au-delà de la maintenance prédictive, l'entreprise prévoit de poursuivre de nombreux autres projets ML. Le succès initial de l'entreprise l'a aidée à développer ce qu'elle appelle une stratégie « BYOA » (bring your own algorithm), impliquant des instances Spot, Amazon SageMaker et Amazon EKS.
Désormais, l'entreprise fonctionne en grande partie sur AWS, ce qui lui permet d'itérer plus rapidement qu'auparavant ; cela équivaut à passer du rail traditionnel au rail à grande vitesse. L'équipe a même décidé d'étendre le champ d'application de la solution pour y inclure des fonctions de géocartographie qui aideront à prendre des décisions clés et faciliteront davantage la maintenance des ressources.
À propos de SNCF Réseau
Réseau SNCF est une filiale de la Société Nationale des Chemins de Fer Français (SNCF), la compagnie de transport ferroviaire nationale française. SNCF Réseau exploite et gère l'infrastructure du réseau ferroviaire de la SNCF qui se compose d'environ 32 000 km de lignes ferroviaires.
Avantages d'AWS
- Réduction du temps de déploiement IA/ML de 3-6 mois à 1 semaine
- Déploiement du code sur le nouveau système ML en 2 semaines
- Réduction du temps d'entraînement de modèle de 3 jours à 10 heures
- Réduction des délais de livraison des projets de 3 mois à moins de 48 heures
- Réduction de 71 % des coûts liés à la science des données
Services AWS utilisés
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) est un service Web qui fournit une capacité de calcul sécurisée et redimensionnable dans le cloud. Destiné aux développeurs, il est conçu pour faciliter l'accès aux ressources de cloud computing à l'échelle du Web.
Instances Spot Amazon EC2
Les instances Spot Amazon EC2 vous permettent de profiter des capacités EC2 non utilisées dans le cloud AWS. Les instances Spot sont disponibles avec une réduction allant jusqu'à 90 % par rapport aux tarifs des instances à la demande.
Amazon SageMaker
Amazon SageMaker aide les scientifiques des données et les développeurs à préparer, créer, entraîner et déployer rapidement des modèles d'apprentissage automatique (ML) de haute qualité en rassemblant un large éventail de fonctionnalités conçues spécialement pour l'apprentissage automatique.
Amazon EKS
Amazon Elastic Kubernetes Service (Amazon EKS) vous offre la possibilité de démarrer, d'exécuter et de mettre à l'échelle des applications Kubernetes dans le Cloud AWS ou sur site.
Démarrer
Les entreprises de toute taille et de tous les secteurs d'activités transforment chaque jour leurs activités à l'aide d'AWS. Contactez nos spécialistes et commencez dès aujourd'hui votre transition vers le Cloud AWS.