La società ferroviaria nazionale francese riduce i costi e aumenta la produttività su AWS
2021
La società ferroviaria di stato francese, Société Nationale des Chemins de Fer Français (SNCF), ha bisogno di sofisticate tecnologie per la gestione e il controllo della sicurezza lungo i suoi 32.000 km di binari. Nel 2017 SNCF Réseau, la sua società controllata che si occupa della manutenzione e della gestione delle infrastrutture ferroviarie di SNCF, si è posta l'obiettivo di creare una soluzione di visione artificiale in grado di sfruttare le immagini catturate dalle telecamere dei treni per aiutare l’azienda a identificare potenziali malfunzionamenti nei binari e anticipare, di conseguenza, le esigenze di manutenzione. Tuttavia i data center legacy di SNCF Réseau non disponevano dell’agilità e della velocità effettiva di cui la società aveva bisogno e stavano diventando sempre più obsoleti e costosi da mantenere. Anche se SNCF Réseau aveva accesso a una grande quantità di dati, questi erano in gran parte segregati e inadatti all'analisi necessaria per rendere possibile la soluzione di machine learning (ML) che l'azienda aveva previsto.
Cercando di modernizzare la sua infrastruttura tecnologica, SNCF Réseau ha utilizzato Olexya, un partner di consulenza Amazon Web Services (AWS), per migrare i carichi di lavoro su AWS. Il vasto processo di migrazione ha comportato anche il passaggio dal framework ML di SNCF Réseau ad Amazon SageMaker, il servizio completamente gestito che aiuta i data scientist e gli sviluppatori a preparare, realizzare, formare e distribuire modelli di ML di alta qualità in modo rapido, grazie a una vasta gamma di competenze appositamente sviluppate per il ML. Con AWS il team ha ridotto i tempi di formazione dei modelli da 3 giorni a 10 ore. In seguito alla migrazione sul cloud, SNCF Réseau è sul punto di implementare la manutenzione predittiva basata su ML e dati intelligenti, nonché di sbloccare il potenziale del ML per tante altre iniziative per tutta la società.
Amazon SageMaker e le istanze Spot sono stati essenziali per semplificare e accelerare l’implementazione degli algoritmi di IA/ML.”
Samuel Descroix
Head Manager della divisione Geographic and Analytic Data
SNCF Réseau
Modernizzazione e standardizzazione sul Cloud
SNCF Réseau è il risultato della riunificazione, nel 2015, della rete ferroviaria francese (nota in Francia come Réseau Ferré de France, o RFF) e di SNCF, che fino al 2015 avevano sistemi informativi separati. Dopo la riunificazione, la mancanza di standardizzazione ha ostacolato gli scambi con i manager nei paesi vicini. Sempre attenta a manutenzione, modernizzazione e sicurezza, SNCF Réseau ha cercato a lungo di standardizzare i dati e di ottimizzarne l’utilità per la società e per i suoi partner europei. Così, a partire dal 2019, la società ha deciso di riprogettare gran parte delle sue infrastrutture di legacy su AWS. SNCF Réseau ha stabilito che l'ampiezza degli AWS Managed Services ha soddisfatto le aspettative dell'azienda di accelerare l'implementazione della sua strategia Smart Data, un nuovo approccio radicale alla raccolta e all'analisi rapida dei dati rilevanti per la manutenzione delle rotaie SNCF utilizzando sensori intelligenti quasi in tempo reale.
Uno dei primi passaggi ha comportato la migrazione dei dati a un data lake in Amazon Simple Storage Service (Amazon S3), un servizio di archiviazione di oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore. Nel tentativo di evitare le criticità relative ai dati isolati e alle definizioni non standard, la società ha sviluppato un modello Ariane, ovvero un linguaggio di modellazione unificato, per allineare le definizioni di ferrovie, traffico, manutenzione e altri elementi chiave, normalizzando i dati dopo la raccolta. Basato su RailTopoModel, un modello sistemico utilizzato da diverse organizzazioni europee, Ariane ha rappresentato un importante passo avanti nella standardizzazione regionale e per la comunicazione di informazioni normative e relative alla conformità.
Definizioni chiare e standardizzate hanno contribuito alla creazione, da parte di SNCF Réseau, di un data lake “pulito” su Amazon S3. Invece di immettere dati non elaborati in un data lake e di applicare un livello di intelligence per dare un senso a tali dati, la società ha sviluppato gli strumenti per definire oggetti rilevanti per particolari casi d’uso, tra cui il ML, prima di inserirli nel data lake. “A differenza di una “palude” di dati, un data lake pulito fornisce il giusto livello di fiducia nei dati di cui i manager hanno bisogno per mettere a punto una strategia e prendere le decisioni giuste”, afferma Samuel Descroix, Head Manager del dipartimento dati geografici e analitici di SNCF Réseau. Partendo da qui, i data scientist hanno potuto effettuare query sui dati usando Amazon Athena, un servizio di query interattivo che permette di analizzare in modo semplice i dati su Amazon S3, grazie a un linguaggio di query standard strutturato.
Ottimizzare il ML su AWS riducendo i costi
Un elemento chiave della modernizzazione di SNCF Réseau è il suo modello di visione artificiale, ideato per individuare malfunzionamenti o problemi sui binari e per anticipare le esigenze di manutenzione. Nel 2017, la società ha iniziato a sviluppare algoritmi di intelligenza artificiale (IA) e ML su Python 2.7 con il framework di deep learning Caffe2. Tuttavia, i suoi data center on-premise non disponevano dell’agilità e della velocità effettiva necessarie per consentire un ML efficace, e la formazione dei modelli richiedeva fino a tre giorni. Con la migrazione su AWS e la creazione di un data lake pulito su Amazon S3, la società ha avuto l’opportunità di approfittare della suite di servizi su AWS adattando il suo framework Caffe2 per essere formata e implementata da ambienti gestiti di AWS, tra cui Amazon SageMaker.
Nel marzo del 2020, la società ha implementato il codice sul suo nuovo sistema su AWS dopo soltanto due settimane di messa a punto. Grazie al suo framework ora su AWS, i data scientist di SNCF Réseau hanno potuto approfittare di una maggiore autonomia nei casi d’uso del ML, avendo accesso agli strumenti giusti al momento giusto. “Molte operazioni che prima erano complicate per i data scientist sono state ampiamente semplificate su Amazon SageMaker”, afferma Descroix. Favoriti da questa relativa semplicità, i processi di addestramento sono scesi da tre giorni sul vecchio sistema a sole dieci ore sul nuovo sistema, una riduzione di quasi il 90%.
Inoltre, l'azienda è stata anche in grado di ottimizzare i costi utilizzando le istanze Spot di Amazon Elastic Compute Cloud (Amazon EC2), il che ha aiutato SNCF Réseau a sfruttare la capacità inutilizzata di Amazon EC2 su AWS con un forte sconto. Dato che i carichi di lavoro di ML della società sono complessi dal punto di vista dei calcoli ma non sensibili al fattore tempo, l’utilizzo delle istanze Spot attraverso Managed Spot Training su Amazon SageMaker si è rivelato fondamentale, permettendo al team di risparmiare il 71% dei costi di data science rispetto alle istanze on demand di Amazon EC2. “Amazon SageMaker e le istanze Spot sono stati essenziali per semplificare e accelerare l’implementazione degli algoritmi di IA/ML”, afferma Descroix.
Olexya è stata in grado di supportare SNCF Réseau nella creazione di un team DevOps per l'implementazione di AWS, aiutando a ridurre i tempi di consegna dei progetti da tre mesi con il sistema legacy a meno di 48 ore sul nuovo sistema. Si sta lavorando ancora per ridurre ulteriormente questi tempi e automatizzare completamente l’implementazione senza alcuna interazione umana. Una parte importante di questo processo si basa su Amazon Elastic Kubernetes Service (Amazon EKS), che aiuta gli utenti a fornire cluster altamente disponibili e sicuri e ad automatizzare operazioni fondamentali come patching, provisioning di nodi e aggiornamenti. Un altro importante vantaggio ottenuto grazie ad AWS riguarda il tempo necessario per impostare l’infrastruttura (compresa l’accelerazione dei modelli formati tramite dati, usando le risorse necessarie fornite), che è diminuito da 3-6 mesi a una sola settimana.
Espandere il potenziale del ML all’interno di tutta la società
A gennaio 2021, SNCF Réseau ha iniziato a dedicarsi all’ottimizzazione dell’algoritmo di manutenzione predittiva per la produzione e la scelta degli strumenti appropriati per le sue vetture. Oltre alla manutenzione predittiva, la società prevede di portare avanti tante altre iniziative basate sul ML. Il successo iniziale dell'azienda l’ha aiutata a sviluppare la cosiddetta strategia "BYOA" (bring your own algorithm), che coinvolge istanze Spot, Amazon SageMaker e Amazon EKS.
Lavorando ora in gran parte su AWS, l'azienda può iterare più rapidamente di prima: l'equivalente ML del passaggio dalla ferrovia tradizionale alla ferrovia ad alta velocità. Il team ha perfino deciso di ampliare il campo di applicazione della sua soluzione, fino a includere funzioni di geolocalizzazione che possano permettere di prendere decisioni chiave e di semplificare la manutenzione.
Informazioni su SNCF Réseau
SNCF Réseau è una società controllata di Société Nationale des Chemins de Fer Français (SNCF), la società ferroviaria nazionale francese. SNCF Réseau si occupa del funzionamento e della gestione dell’infrastruttura della rete ferroviaria di SNCF, composta da circa 32.000 km di binari.
Vantaggi di AWS
- Riduzione del tempo di implementazione di IA/ML da tre-sei mesi a una settimana
- Implementazione del codice sul nuovo sistema ML entro due settimane
- Riduzione del tempo di addestramento dei modelli da tre giorni a dieci ore
- Riduzione dei tempi di consegna dei progetti da tre mesi a meno di 48 ore
- Riduzione dei costi di data science del 71%
Servizi AWS utilizzati
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) è un servizio Web che fornisce capacità di elaborazione sicura e scalabile nel cloud. È concepito per rendere più semplice il cloud computing su scala Web per gli sviluppatori.
Istanze Spot di Amazon EC2
Le istanze Spot di Amazon EC2 ti permettono di sfruttare la capacità EC2 inutilizzata all'interno di AWS Cloud. Le istanze Spot sono disponibili con prezzi scontati fino al 90% inferiori rispetto ai prezzi delle istanze on demand.
Amazon SageMaker
Amazon SageMaker aiuta sviluppatori e data scientist a preparare, creare, addestrare e implementare rapidamente modelli di machine learning (ML) di alta qualità combinando un’ampia gamma di funzionalità create ad hoc per il ML.
Amazon EKS
Amazon Elastic Kubernetes Service (Amazon EKS) ti offre la flessibilità di avviare, eseguire e ridimensionare le applicazioni Kubernetes in AWS Cloud o in locale.
Nozioni di base
Le aziende di tutte le taglie e di tutti i settori stanno trasformando ogni giorno la propria attività grazie ad AWS. Contatta i nostri esperti e inizia subito il tuo viaggio nel Cloud AWS