Französische Staatseisenbahn realisiert dank AWS Kosteneinsparung und Produktivitätssteigerung

2021

Die französische Staatseisenbahn SNCF (Société Nationale des Chemins de Fer Français) benötigt moderne Technologie, um für ihr 32 000 km langes Streckennetz die Managementaufgaben durchführen und für Sicherheit sorgen zu können. SNCF Réseau, die Tochtergesellschaft der SNCF, die für die Instandhaltung und Verwaltung der Eisenbahninfrastruktur zuständig ist, wollte 2017 eine Bildverarbeitungslösung entwickeln, die mit Hilfe der von den Zugkameras aufgenommenen Bilder potenzielle Störungen im Schienenverkehr erkennen und den Wartungsbedarf vorhersehen kann. Die älteren Rechenzentren von SNCF Réseau verfügten aber nicht über die gewünschte Flexibilität und Durchsatzkapazität. Darüber hinaus waren sie nicht auf dem neuesten Stand und es entstanden hohe Wartungskosten. Obwohl SNCF Réseau Zugang zu großen Datenmengen hatte, waren diese größtenteils ungeeignet für Analysen, wie sie für die Machine-Learning (ML)-Lösungen, die das Unternehmen anstrebte nötig gewesen wären. 

Um seine technologische Infrastruktur zu modernisieren, nutzte SNCF Réseau Olexya, einen Amazon Web Services (AWS) Premiumberatungspartner, um ihre Workloads auf AWS zu migrieren. Bei dieser umfassenden Migration wurde u. a. das ML-Framework von SNCF Réseau auf Amazon SageMaker umgestellt. SageMaker ist ein vollständig verwalteter Service, mit dem Datenwissenschaftler und Entwickler in kurzer Zeit ML-Modelle von hoher Qualität vorbereiten, erstellen, trainieren und bereitstellen können, indem sie die umfangreichen speziellen ML-Funktionen nutzen. Mithilfe von AWS konnte das Team die Dauer für das Modelltraining von drei Tagen auf zehn Stunden reduzieren. Dank der Cloudnutzung kann SNCF Réseau jetzt die vorausschauende Wartung auf Basis von ML-Daten und intelligenten Daten realisieren und das große Potenzial von ML für viele weitere Initiativen im gesamten Unternehmen nutzen.

Ligne LGV au nord de la France
kr_quotemark

„Amazon SageMaker und Spot-Instances waren bei der Vereinfachung und Beschleunigung der Bereitstellung von KI- bzw. ML-Algorithmen von entscheidender Bedeutung.“, sagt Descroix.

Samuel Descroix
Verantwortlicher für geographische und analytische Daten
SNCF Réseau

Modernisieren und Standardisieren in der Cloud

SNCF Réseau ist das Ergebnis der Wiedervereinigung des Unternehmens für das französische Streckennetz (Réseau Ferré de France, RFF) mit SNCF, die im Jahr 2015 vollzogen wurde. Bis 2015 hatten diese beiden Unternehmen separate IT-Systeme. Nach dieser Wiedervereinigung hat eine mangelnde Standardisierung dazu geführt, dass der Austausch mit Managern in den Nachbarländern nicht wie gewünscht erfolgen konnte. Da der Schwerpunkt bei SNCF Réseau auf den Bereichen Wartung, Modernisierung und Sicherheit liegt, hat das Unternehmen schon seit Längerem nach einer Möglichkeit gesucht, seine Daten zu standardisieren und somit den Nutzen innerhalb des eigenen Unternehmens und im Austausch mit seinen europäischen Partnern zu erhöhen. Aus diesem Grund wurde im Unternehmen die Entscheidung getroffen, ab dem Jahr 2019 einen Großteil der Legacyinfrastruktur in AWS neu zu entwerfen. SNCF Réseau stellte fest, dass die Breite der verwalteten AWS-Services die Erwartungen des Unternehmens zur Beschleunigung der Implementierung seiner Smart Data-Strategie erfüllte – ein komplett neuer Ansatz zur Erfassung und schnellen Analyse von Daten in nahezu Echtzeit aus intelligenten Sensoren, die für die Instandhaltung der SNCF-Schienen unverzichtbar sind.

Einer der ersten Schritte war die Migration von Daten in einen Data Lake imAmazon Simple Storage Service (Amazon S3). Dies ist ein Objektspeicherservice, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet. Da etwaige Schwierigkeiten aufgrund von nicht zentralisierten Daten und nicht dem Standard entsprechenden Definitionen umgangen werden sollten, hat das Unternehmen das „Ariane“-Modell entwickelt. Hierbei handelt es sich um eine einheitliche Modellierungssprache, mit der die Definitionen für Schienen, Zugverkehr, Wartung und andere wichtige Bereiche vereinheitlicht werden, um die Daten nach der Erfassung quasi zu „normalisieren“. Ariane basiert auf RailTopoModel, einem Systemmodell, das von mehreren europäischen Organisationen genutzt wird. Dies ist ein wichtiger Schritt hin zur regionalen Standardisierung und zur Realisierung der Berichterstellung in Bezug auf die Einhaltung von Bestimmungen und Compliance. 

Klara Standarddefinitionen erleichterten SNCF Réseau einen „sauberen“ Data Lake in Amazon S3 zu erstellen. Anstatt einfach Rohdaten in einem Data Lake anzuordnen und mit intelligenten Funktionen zu versuchen, diese zu analysieren, hat das Unternehmen ein Mittel zum Definieren von Objekten entwickelt, die für bestimmte Anwendungsfälle relevant sind (z. B. ML). Erst anschließend werden die Daten dann im Data Lake abgelegt. „Im Gegensatz zur Verwendung eines „Datensumpfes“ kann mit einem bereinigten Data Lake das Vertrauen in Daten geschaffen werden, das Manager benötigen, um eine Strategie formulieren und die richtigen Entscheidungen treffen zu können“, sagt Samuel Descroix, leitender Manager der Abteilung für geografische Daten und Analysedaten bei SNCF Réseau. Auf dieser Grundlage haben Datenwissenschaftler die Möglichkeit, Daten mit Amazon Athena abzufragen. Hierbei handelt es sich um einen Service für interaktive Abfragen, mit dem es einfach ist, Daten in Amazon S3 mithilfe einer standardmäßigen Structured Query Language zu analysieren.

Optimieren von ML in AWS und Sparen von Kosten

Ein wichtiger Bestandteil der Modernisierungsmaßnahmen bei SNCF Réseau ist das Computervision-Modell. Es ist so konzipiert, dass Fehlfunktionen bzw. Probleme auf Eisenbahnstrecken identifiziert und erforderliche Wartungsarbeiten besser antizipiert werden können. Im Jahr 2017 hat das Unternehmen damit begonnen, in Python 2.7 mit dem Deep Learning-Framework Caffe2 Algorithmen für künstliche Intelligenz (KI) bzw. ML zu entwickeln. Die On-Premises-Rechenzentren verfügten aber nicht über die Flexibilität und Durchsatzkapazität, die für effektive ML-Abläufe benötigt werden, und das Trainieren der Modelle dauerte bis zu drei Tage. Nach der Migration zu AWS und der Einrichtung eines bereinigten Data Lake in Amazon S3 konnte das Unternehmen die Service-Suite in AWS nutzen, indem es sein Caffe2-Framework so angepasst hat, dass es über die verwalteten AWS-Umgebungen (z. B. Amazon SageMaker) trainiert und bereitgestellt wurde. 

Im März 2020 konnte das Unternehmen den Code nach nur zwei Wochen Optimierungsdauer unter AWS auf seinem neuen System bereitstellen. Da sich das Framework nun in AWS befand, konnten die Datenwissenschaftler von SNCF Réseau bei ihren ML-Anwendungsfällen weitestgehend autonom vorgehen und bei Bedarf immer auf die richtigen Tools zugreifen. „Viele Aufgaben, die für Datenwissenschaftler sehr komplex waren, wurden durch Amazon SageMaker stark vereinfacht“, so Descroix. Gestützt auf diesen relativ simplen Workflow konnte die Trainingszeit für Modelle von drei Tagen im alten System auf lediglich 10 Stunden im neuen System reduziert werden: Eine Reduzierung um fast 90 Prozent. 

Außerdem war das Unternehmen in der Lage seine Ausgaben zu durch die Verwendung von Amazon Elastic Compute Cloud (Amazon EC2) Spot-Instances zu optimieren, weil diese SNCF Réseau erleichterten ungenutzte Amazon EC2-Kapazitäten auf AWS mit einem deutlichen Rabatt zu verwenden. Da die ML-Workloads des Unternehmens zwar rechenintensiv, aber nicht zeitkritisch sind, war die Verwendung von Spot-Instances per Managed Spot Training in Amazon SageMaker sehr hilfreich. Im Vergleich zu Amazon EC2 On-Demand-Instances konnte das Team bei den Data Science-Kosten letztendlich eine Einsparung in Höhe von 71 Prozent erzielen. „Amazon SageMaker und Spot-Instances waren bei der Vereinfachung und Beschleunigung der Bereitstellung von KI- bzw. ML-Algorithmen von entscheidender Bedeutung.“, sagt Descroix. 

Olexya unterstützte SNCF Réseau erfolgreich bei der Aufstellung eines DevOps-Teams für die AWS-Bereitstellung. So konnte die durchschnittliche Lieferzeit für Projekte von 3 Monaten auf dem alten System auf lediglich 48 Stunden auf dem neuen System reduziert werden. Derzeit wird daran gearbeitet, diese Zeiträume noch weiter zu reduzieren und die Bereitstellung vollständig zu automatisieren, ohne dass der Eingriff eines Menschen erforderlich ist. Eine zentrale Komponente ist hierbei der Amazon Elastic Kubernetes Service (Amazon EKS), mit dem Benutzer hoch verfügbare und sichere Cluster bereitstellen und wichtige Aufgaben automatisieren können, z. B. Patchen, Knotenbereitstellung und Updates. Ein weiterer wichtiger Vorteil der Entwicklung in AWS ist die benötigte Zeit für die Einrichtung der Infrastruktur, z. B. anhand von Daten trainierte Modelle mit den erforderlichen bereitgestellten Ressourcen. Der Zeitraum konnte hierbei von drei bis sechs Monaten auf nur noch eine Woche verkürzt werden.

Steigern des ML-Potenzials im gesamten Unternehmen

Im Januar 2021 hat SNCF Réseau mit der Optimierung seines Algorithmus für die vorausschauende Wartung in der Produktion und der Ermittlung der passenden Hardware für die Trainer begonnen. Neben der vorausschauenden Wartung plant das Unternehmen noch viele weitere Initiativen, bei denen ML eingesetzt werden soll. Der anfängliche Erfolg ermöglichte dem Unternehmen seine so genannte „BYOA“-Strategie (Bring your own Algorithm) zu entwickeln, die sich auf Spot Instances, Amazon SageMaker und Amazon EKS stützt. 

Da das Unternehmen nun größtenteils über AWS arbeitet, kann es Prozesse deutlich schneller als zuvor durchführen – es hat gewissermaßen in der Welt des ML den Schritt von der traditionellen Schiene auf die Hochgeschwindigkeitsstrecke gewagt. Das Team hat sich sogar dafür entschieden, den Umfang der Lösung auf Geomapping-Funktionen zu erweitern, die als Hilfe beim Treffen wichtiger Entscheidungen dienen und die Wartung der Ressourcen weiter vereinfachen.


Informationen zu SNCF Réseau

SNCF Réseau ist ein Tochterunternehmen der französischen Staatseisenbahn SNCF (Société Nationale des Chemins de Fer Français). SNCF Réseau betreibt und managt die Infrastruktur des Streckennetzes von SNCF, das eine Länge von ca. 32 000 km hat.

Vorteile von AWS

  • KI/ML-Bereitstellungszeit von 3 bis 6 Monaten auf 1 Woche reduziert
  • Code innerhalb von zwei Wochen auf neuen ML-Systemen bereit gestellt
  • Von 3 Tagen auf zehn Stunden reduzierte Trainingszeit für Modelle
  • Projektlieferzeit konnte von 3 Monaten auf weniger als 48 Stunden reduziert werden
  • Datenwissenschafts-Kosten konnten um 71 % reduziert werden

Genutzte AWS-Services

Amazon EC2

Der Web-Service Amazon Elastic Compute Cloud (Amazon EC2) stellt sichere, skalierbare Rechenkapazitäten in der Cloud bereit. Der Service ist darauf ausgelegt, Web-Scale-Cloud-Computing für Entwickler zu erleichtern.

Weitere Informationen »

Amazon EC2-Spot-Instances

Mit Amazon EC2 Spot-Instances können Sie die Vorteile nicht genutzter EC2-Kapazitäten in der AWS Cloud nutzen. Spot-Instances sind mit einem Rabatt von bis zu 90 % im Vergleich zum On-Demand-Preis verfügbar. 

Weitere Informationen »

Amazon SageMaker

Amazon SageMaker unterstützt Datenwissenschaftler und Entwickler bei der Vorbereitung, der Erstellung, dem Training und der Bereitstellung hochwertiger Machine Learning (ML)-Modelle durch eine breite Palette von speziell für ML entwickelten Funktionen.

Weitere Informationen »

Amazon EKS

Amazon Elastic Kubernetes Service (Amazon EKS) bietet Ihnen die nötige Flexibilität, um Kubernetes-Anwendungen in der AWS Cloud oder lokal zu starten, auszuführen und zu skalieren. 

Weitere Informationen »


Erste Schritte

Unternehmen jeder Größe und aus jeder Branche transformieren ihr Geschäft mit AWS. Kontaktieren Sie unsere Experten und begeben Sie sich noch heute auf Ihre eigene AWS-Cloud-Reise.