SNCF_Logo

Französische Staatseisenbahn realisiert dank AWS Kosteneinsparung und Produktivitätssteigerung

2021

Die französische Staatseisenbahn SNCF (Société Nationale des Chemins de Fer Français) benötigt moderne Technologie, um für ihr 32 000 km langes Streckennetz die Managementaufgaben durchführen und für Sicherheit sorgen zu können. Das Tochterunternehmen SNCF Réseau ist dafür verantwortlich, die Infrastruktur des Streckennetzes von SNCF zu warten und zu managen. Im Jahr 2017 hat das Unternehmen mit der Entwicklung einer Lösung für Computervision (Maschinelles Sehen) begonnen, bei der von Zugkameras aufgenommene Bilder genutzt werden können, um potenzielle Schäden am Streckennetz zu identifizieren und erforderliche Wartungsarbeiten zu antizipieren. Die älteren Rechenzentren von SNCF Réseau verfügten aber nicht über die gewünschte Flexibilität und Durchsatzkapazität. Darüber hinaus waren sie nicht auf dem neuesten Stand und es entstanden hohe Wartungskosten. SNCF Réseau hatte zwar Zugriff auf große Datenmengen, aber diese lagen meist nur separat vor und waren nicht für die Analyseschritte geeignet, die für die gewünschte Machine Learning-Lösung (ML) des Unternehmens benötigt wurden. 

Mit dem Ziel, seine technische Infrastruktur zu modernisieren, hat sich SNCF Réseau an Olexya, einen Amazon Web Services (AWS) Select Consulting Partner, gewendet, um seine Workloads zu AWS zu migrieren. Bei dieser umfassenden Migration wurde u. a. das ML-Framework von SNCF Réseau auf Amazon SageMaker umgestellt. SageMaker ist ein vollständig verwalteter Service, mit dem Datenwissenschaftler und Entwickler in kurzer Zeit ML-Modelle von hoher Qualität vorbereiten, erstellen, trainieren und bereitstellen können, indem sie die umfangreichen speziellen ML-Funktionen nutzen. Mithilfe von AWS konnte das Team die Dauer für das Modelltraining von drei Tagen auf zehn Stunden reduzieren. Dank der Cloudnutzung kann SNCF Réseau jetzt die vorausschauende Wartung auf Basis von ML-Daten und intelligenten Daten realisieren und das große Potenzial von ML für viele weitere Initiativen im gesamten Unternehmen nutzen.

Hochgeschwindigkeitszug
kr_quotemark

„Amazon SageMaker und Spot-Instances waren bei der Vereinfachung und Beschleunigung der Bereitstellung von KI- bzw. ML-Algorithmen von entscheidender Bedeutung.“

Samuel Descroix
Head Manager of Geographic and Analytic Data
SNCF Réseau

Modernisieren und Standardisieren in der Cloud

SNCF Réseau ist das Ergebnis der Wiedervereinigung des Unternehmens für das französische Streckennetz (Réseau Ferré de France, RFF) mit SNCF, die im Jahr 2015 vollzogen wurde. Bis 2015 hatten diese beiden Unternehmen separate IT-Systeme. Nach dieser Wiedervereinigung hat eine mangelnde Standardisierung dazu geführt, dass der Austausch mit Managern in den Nachbarländern nicht wie gewünscht erfolgen konnte. Da der Schwerpunkt bei SNCF Réseau auf den Bereichen Wartung, Modernisierung und Sicherheit liegt, hat das Unternehmen schon seit Längerem nach einer Möglichkeit gesucht, seine Daten zu standardisieren und somit den Nutzen innerhalb des eigenen Unternehmens und im Austausch mit seinen europäischen Partnern zu erhöhen. Aus diesem Grund wurde im Unternehmen die Entscheidung getroffen, ab dem Jahr 2019 einen Großteil der Legacyinfrastruktur in AWS neu zu entwerfen. SNCF Réseau hat erkannt, dass die umfassenden AWS Managed Services die Erwartungen erfüllen, die das Unternehmen in Bezug auf die Implementierung seiner Strategie für intelligente Daten (Smart Data) hat. Es geht hierbei um einen weit reichenden neuen Ansatz für die Erfassung und schnelle Analyse der Daten, die für die Wartung des SNCF-Netzes relevant sind. Zu diesem Zweck werden intelligente Sensoren genutzt, bei denen die Daten nahezu in Echtzeit bereitgestellt werden.

Eine der ersten Maßnahmen bestand darin, Daten zu einem Data Lake in Amazon Simple Storage Service (Amazon S3) zu migrieren. Dies ist ein Service für die Speicherung von Objekten, bei dem branchenführende Optionen in Bezug auf die Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung genutzt werden können. Da etwaige Schwierigkeiten aufgrund von nicht zentralisierten Daten und nicht dem Standard entsprechenden Definitionen umgangen werden sollten, hat das Unternehmen das „Ariane“-Modell entwickelt. Hierbei handelt es sich um eine einheitliche Modellierungssprache, mit der die Definitionen für Schienen, Zugverkehr, Wartung und andere wichtige Bereiche vereinheitlicht werden, um die Daten nach der Erfassung quasi zu „normalisieren“. Ariane basiert auf RailTopoModel, einem Systemmodell, das von mehreren europäischen Organisationen genutzt wird. Dies ist ein wichtiger Schritt hin zur regionalen Standardisierung und zur Realisierung der Berichterstellung in Bezug auf die Einhaltung von Bestimmungen und Compliance. 

Mithilfe von eindeutigen Standarddefinitionen konnte SNCF Réseau einen „bereinigten“ Data Lake in Amazon S3 erstellen. Anstatt einfach Rohdaten in einem Data Lake anzuordnen und mit intelligenten Funktionen zu versuchen, diese zu analysieren, hat das Unternehmen ein Mittel zum Definieren von Objekten entwickelt, die für bestimmte Anwendungsfälle relevant sind (z. B. ML). Erst anschließend werden die Daten dann im Data Lake abgelegt. „Im Gegensatz zur Verwendung eines „Datensumpfes“ kann mit einem bereinigten Data Lake das Vertrauen in Daten geschaffen werden, das Manager benötigen, um eine Strategie formulieren und die richtigen Entscheidungen treffen zu können“, sagt Samuel Descroix, leitender Manager der Abteilung für geografische Daten und Analysedaten bei SNCF Réseau. Auf dieser Grundlage haben Datenwissenschaftler die Möglichkeit, Daten mit Amazon Athena abzufragen. Hierbei handelt es sich um einen Service für interaktive Abfragen, mit dem es einfach ist, Daten in Amazon S3 mithilfe einer standardmäßigen Structured Query Language zu analysieren.

Optimieren von ML in AWS und Sparen von Kosten

Ein wichtiger Bestandteil der Modernisierungsmaßnahmen bei SNCF Réseau ist das Computervision-Modell. Es ist so konzipiert, dass Fehlfunktionen bzw. Probleme auf Eisenbahnstrecken identifiziert und erforderliche Wartungsarbeiten besser antizipiert werden können. Im Jahr 2017 hat das Unternehmen damit begonnen, in Python 2.7 mit dem Deep Learning-Framework Caffe2 Algorithmen für künstliche Intelligenz (KI) bzw. ML zu entwickeln. Die On-Premises-Rechenzentren verfügten aber nicht über die Flexibilität und Durchsatzkapazität, die für effektive ML-Abläufe benötigt werden, und das Trainieren der Modelle dauerte bis zu drei Tage. Nach der Migration zu AWS und der Einrichtung eines bereinigten Data Lake in Amazon S3 konnte das Unternehmen die Service-Suite in AWS nutzen, indem es sein Caffe2-Framework so angepasst hat, dass es über die verwalteten AWS-Umgebungen (z. B. Amazon SageMaker) trainiert und bereitgestellt wurde. 

Im März 2020 konnte das Unternehmen den Code nach nur zwei Wochen Optimierungsdauer unter AWS auf seinem neuen System bereitstellen. Da sich das Framework nun in AWS befand, konnten die Datenwissenschaftler von SNCF Réseau bei ihren ML-Anwendungsfällen weitestgehend autonom vorgehen und bei Bedarf immer auf die richtigen Tools zugreifen. „Viele Aufgaben, die für Datenwissenschaftler sehr komplex waren, wurden durch Amazon SageMaker stark vereinfacht“, so Descroix. Dank dieser vergleichsweise einfachen Vorgehensweise konnte die Dauer von Trainingsaufträgen von drei Tagen auf dem alten System auf nur noch zehn Stunden auf dem neuen System verkürzt werden. Dies entspricht einer Reduzierung von fast 90 Prozent. 

Darüber hinaus konnte das Unternehmen auch die Kosten optimieren, indem die Spot-Instances der Amazon Elastic Compute Cloud (Amazon EC2) verwendet wurden. Auf diese Weise hatte SNCF Réseau die Möglichkeit, ungenutzte Amazon EC2-Kapazität von AWS zu einem attraktiven Rabattpreis zu nutzen. Da die ML-Workloads des Unternehmens zwar rechenintensiv, aber nicht zeitkritisch sind, war die Verwendung von Spot-Instances per Managed Spot Training in Amazon SageMaker sehr hilfreich. Im Vergleich zu Amazon EC2 On-Demand-Instances konnte das Team bei den Data Science-Kosten letztendlich eine Einsparung in Höhe von 71 Prozent erzielen. „Amazon SageMaker und Spot-Instances waren bei der Vereinfachung und Beschleunigung der Bereitstellung von KI- bzw. ML-Algorithmen von entscheidender Bedeutung“, meint Descroix. 

Olexya konnte SNCF Réseau beim Einrichten eines DevOps-Teams für die AWS-Bereitstellung unterstützen und den Zeitraum für die Bereitstellung von Projekten von drei Monaten (altes System) auf weniger als 48 Stunden (neues System) reduzieren. Derzeit wird daran gearbeitet, diese Zeiträume noch weiter zu reduzieren und die Bereitstellung vollständig zu automatisieren, ohne dass der Eingriff eines Menschen erforderlich ist. Eine zentrale Komponente ist hierbei der Amazon Elastic Kubernetes Service (Amazon EKS), mit dem Benutzer hoch verfügbare und sichere Cluster bereitstellen und wichtige Aufgaben automatisieren können, z. B. Patchen, Knotenbereitstellung und Updates. Ein weiterer wichtiger Vorteil der Entwicklung in AWS ist die benötigte Zeit für die Einrichtung der Infrastruktur, z. B. anhand von Daten trainierte Modelle mit den erforderlichen bereitgestellten Ressourcen. Der Zeitraum konnte hierbei von drei bis sechs Monaten auf nur noch eine Woche verkürzt werden.

Steigern des ML-Potenzials im gesamten Unternehmen

Im Januar 2021 hat SNCF Réseau mit der Optimierung seines Algorithmus für die vorausschauende Wartung in der Produktion und der Ermittlung der passenden Hardware für die Trainer begonnen. Neben der vorausschauenden Wartung plant das Unternehmen noch viele weitere Initiativen, bei denen ML eingesetzt werden soll. Aufgrund der erfolgreichen Umstellung konnte das Unternehmen eine „BYOA“-Strategie (Bring Your Own Algorithm) entwickeln, bei der Spot-Instances, Amazon SageMaker und Amazon EKS genutzt werden. 

Da der Betrieb nun größtenteils über AWS erfolgt, sind für das Unternehmen schnellere Iterationen möglich. Bezogen auf ML entspricht dies der Umstellung von herkömmlichen Zügen auf Hochgeschwindigkeitszüge. Das Team hat sich sogar dafür entschieden, den Umfang der Lösung auf Geomapping-Funktionen zu erweitern, die als Hilfe beim Treffen wichtiger Entscheidungen dienen und die Wartung der Ressourcen weiter vereinfachen.


Informationen zu SNCF Réseau

SNCF Réseau ist ein Tochterunternehmen der französischen Staatseisenbahn SNCF (Société Nationale des Chemins de Fer Français). SNCF Réseau betreibt und managt die Infrastruktur des Streckennetzes von SNCF, das eine Länge von ca. 32 000 km hat.

Vorteile von AWS

  • Reduzierung der KI-/ML-Bereitstellungsdauer von drei bis sechs Monaten auf eine Woche
  • Bereitstellung von Code in einem neuen ML-System innerhalb von zwei Wochen
  • Reduzierung der Dauer des Modelltrainings von drei Tagen auf zehn Stunden
  • Reduzierung der Bereitstellungsdauer für Projekte von drei Monaten auf weniger als 48 Stunden
  • Reduzierung der Data Science-Kosten um 71 %

Genutzte AWS-Services

Amazon EC2

Der Web-Service Amazon Elastic Compute Cloud (Amazon EC2) stellt sichere, skalierbare Rechenkapazitäten in der Cloud bereit. Der Service ist darauf ausgelegt, Cloud Computing für Entwickler zu erleichtern.

Weitere Informationen »

Amazon EC2-Spot-Instances

Mit Amazon EC2-Spot-Instances können Sie ungenutzte EC2-Kapazität in der AWS Cloud nutzen. Spot-Instances sind mit einem Rabatt von bis zu 90 % im Vergleich zum On-Demand-Preis verfügbar. 

Weitere Informationen »

Amazon SageMaker

Amazon SageMaker unterstützt Datenwissenschaftler und Entwickler beim schnellen Vorbereiten, Erstellen, Trainieren und Bereitstellen hochwertiger ML-Modelle (Machine Learning), indem eine breite Palette von Funktionen verfügbar gemacht wird, die speziell für ML entwickelt wurden.

Weitere Informationen »

Amazon EKS

Amazon Elastic Kubernetes Service (Amazon EKS) bietet Ihnen die nötige Flexibilität, um Kubernetes-Anwendungen in der AWS Cloud oder lokal zu starten, auszuführen und zu skalieren. 

Weitere Informationen »


Erste Schritte

Unternehmen jeder Größe und jeder Branche transformieren jeden Tag ihr Geschäft mit AWS. Kontaktieren Sie unsere Experten und beginnen Sie noch heute Ihren Weg in die AWS Cloud.