Los ferrocarriles nacionales de Francia reducen costos y aumentan la productividad con AWS
2021
El servicio ferroviario estatal de Francia, Société Nationale des Chemins de Fer Français (SNCF), requiere una sofisticada tecnología para administrar y mantener la seguridad a lo largo de su red ferroviaria que se expande a través de 32.000 km. En 2017 SNCF Réseau, la filial que mantiene y administra la infraestructura ferroviaria de la SNCF, se propuso crear una solución de visión artificial que pudiera utilizar las imágenes captadas por las cámaras de los trenes para ayudar a la empresa a identificar posibles fallos en las vías y prever las necesidades de mantenimiento. Sin embargo, los centros de datos heredados de SNCF Réseau carecían de la agilidad y el rendimiento que la empresa buscaba, se estaban quedando obsoletos y eran caros de mantener. A pesar de que SNCF Réseau tenía acceso a una gran cantidad de datos, estos estaban ampliamente segregados y no eran adecuados para el análisis necesario que permitiera la solución de machine learning (ML) contemplada por la empresa.
Con el objetivo de modernizar su infraestructura tecnológica, SNCF Réseau recurrió a Olexya, un socio consultor selecto de Amazon Web Services (AWS), para migrar las cargas de trabajo a AWS. La extensa migración implicó el cambio del marco de ML de SNCF Réseau a Amazon SageMaker, el servicio completamente administrado que ayuda a los científicos de datos y a los desarrolladores a preparar, crear, entrenar e implementar modelos de ML de alta calidad de forma rápida al reunir un amplio conjunto de capacidades creadas específicamente para el ML. Gracias a AWS, el equipo logró reducir el tiempo de entrenamiento del modelo de tres días a diez horas. Ahora, en la nube, SNCF Réseau está preparada para realizar un mantenimiento predictivo basado en ML y datos inteligentes, así como para desatar el potencial del ML para muchas más iniciativas que se desarrollan a nivel empresarial.
Amazon SageMaker y las instancias de spot fueron fundamentales para simplificar y acelerar la implementación de algoritmos de IA/ML”.
Samuel Descroix
Director de datos geográficos y de análisis
SNCF Réseau
Modernización y estandarización en la nube
SNCF Réseau es el resultado de la unificación en 2015 de la red ferroviaria francesa (conocida en Francia como Réseau Ferré de France, o RFF) y la SNCF, que tenían sistemas de información separados hasta 2015. Tras la unificación, la falta de estandarización obstaculizó los intercambios con los directivos de los países vecinos. Comprometida con el mantenimiento, la modernización y la seguridad, SNCF Réseau ha buscado desde hace tiempo estandarizar los datos y maximizar su funcionalidad dentro de la empresa y en favor de sus socios europeos. Por ello, la empresa decidió rediseñar en AWS gran parte de su infraestructura heredada, a partir de 2019. SNCF Réseau determinó que la amplitud de los servicios administrados por AWS satisfacía las expectativas de la compañía para acelerar la implementación de su estrategia de datos inteligentes, un enfoque nuevo y radical para recopilar y analizar rápidamente los datos relevantes para el mantenimiento de las vías férreas de SNCF mediante sensores inteligentes en tiempo casi real.
Uno de los primeros pasos consistió en migrar los datos a un lago de datos en Amazon Simple Storage Service (Amazon S3), un servicio de almacenamiento de objetos que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en el sector. Para evitar los problemas asociados a la segregación de datos y a las definiciones no estandarizadas, la empresa desarrolló el Modelo Ariane, un lenguaje de modelado unificado, para alinear las definiciones de los ferrocarriles, el tráfico, el mantenimiento y otros elementos clave, con lo que se normalizan los datos tras su recopilación. Basado en RailTopoModel, un modelo sistemático utilizado por varias organizaciones europeas, Ariane representó un paso importante hacia la estandarización regional y la presentación de informes reglamentarios y de conformidad.
Las definiciones claras y estándar ayudaron a SNCF Réseau a crear un lago de datos “limpio” en Amazon S3. En lugar de volcar los datos sin procesar en un lago de datos y aplicar una capa de inteligencia para que tuvieran sentido, la empresa desarrolló los medios para definir los objetos relevantes para casos de uso particulares, incluido el ML, antes de introducirlos en el lago de datos. “A diferencia de un pantano de datos, un lago de datos limpio proporciona el nivel de confianza en los datos que los directivos necesitan para formular estrategias y tomar decisiones correctas”, afirma Samuel Descroix, director del Departamento de Datos Geográficos y Analíticos de SNCF Réseau. Desde entonces, los científicos de datos pueden consultar los datos mediante Amazon Athena, un servicio de consulta interactivo que simplifica el análisis de datos en Amazon S3 con un lenguaje de consulta estructurada estándar.
Optimización del ML en AWS a la vez que se ahorran costos
Un elemento clave de la modernización de SNCF Réseau es su modelo de visión artificial, diseñado para identificar averías o problemas en las líneas ferroviarias y mejorar la previsión de las necesidades de mantenimiento. En 2017, la empresa ya había comenzado a desarrollar algoritmos para la inteligencia artificial (IA)/ML en Python 2.7 con el marco de aprendizaje profundo Caffe2, pero sus centros de datos en las instalaciones carecían de la agilidad y el rendimiento necesarios para proporcionar un ML eficaz, con modelos que tardaban hasta 3 días en entrenarse. Tras haber migrado a AWS y haber establecido un lago de datos limpio en Amazon S3, la empresa vio la oportunidad de aprovechar el conjunto de servicios de AWS al adoptar su marco Caffe2 para ser entrenado e implementado desde entornos administrados por AWS, incluido Amazon SageMaker.
En marzo de 2020, la empresa implementó el código en su nuevo sistema en AWS tras solo 2 semanas de ajuste. Con su marco ahora en AWS, los científicos de datos de SNCF Réseau pueden disfrutar de un alto grado de autonomía para los casos de uso de ML, con acceso a las herramientas adecuadas en el momento adecuado. “Muchas tareas que eran complejas para los científicos de datos se han simplificado enormemente en Amazon SageMaker”, afirma Descroix. Gracias a esta relativa sencillez, los trabajos de entrenamiento se redujeron de tres días que suponía el antiguo sistema a solo 10 horas con el nuevo, lo que supone una reducción de casi el 90 %.
Además, la empresa también logró optimizar los costos mediante el uso de las instancias de spot de Amazon Elastic Compute Cloud (Amazon EC2), lo que ayudó a SNCF Réseau a aprovechar la capacidad no utilizada de Amazon EC2 en AWS con un gran descuento. Dado que las cargas de trabajo de ML de la empresa requieren un uso intensivo de cómputo, pero no son sensibles al tiempo, el uso de las instancias de spot a través de Managed Spot Training en Amazon SageMaker probó ser valioso, y finalmente ahorró al equipo un 71 por ciento en costos de ciencia de datos en comparación con las instancias bajo demanda de Amazon EC2. “Amazon SageMaker y las instancias de spot fueron fundamentales para simplificar y acelerar la implementación de algoritmos de IA/ML”, afirma Descroix.
Olexya logró apoyar a SNCF Réseau en la creación de un equipo de DevOps para la implementación de AWS, lo que ayudó a reducir los tiempos de entrega del proyecto de tres meses con el sistema heredado a menos de 48 horas en el nuevo sistema. Actualmente se trabaja para reducir aún más estos plazos y automatizar completamente la implementación sin interacción humana, para lo cual es fundamental Amazon Elastic Kubernetes Service (Amazon EKS), que ayuda a los usuarios a proporcionar clústeres seguros de alta disponibilidad y automatiza tareas clave como la aplicación de parches, el aprovisionamiento de nodos y las actualizaciones. Otro beneficio importante de crear en AWS fue el tiempo de configuración de la infraestructura, incluida la puesta en marcha de modelos entrenados en datos con los recursos necesarios aprovisionados, que se redujo de entre 3 y 6 meses a solo una semana.
Ampliación del potencial del ML a nivel empresarial
Desde enero de 2021, SNCF Réseau se encuentra en el proceso de optimizar el algoritmo de mantenimiento predictivo para la producción, a la vez que trabaja en la definición del hardware adecuado para sus vagones. Más allá del mantenimiento predictivo, la empresa espera llevar a cabo muchas más iniciativas basadas en el ML El éxito inicial de la compañía ayudó a desarrollar lo que denomina una estrategia “BYOA” (utilice su propio algoritmo), que incluye instancias de spot, Amazon SageMaker y Amazon EKS.
Ahora que opera principalmente en AWS, la empresa puede iterar con mayor rapidez que antes: el equivalente en el ámbito del ML al cambio del ferrocarril tradicional por el de alta velocidad. El equipo ha decidido incluso ampliar el alcance de la solución para incluir características de mapeo geográfico que ayuden a tomar decisiones clave y faciliten aún más el mantenimiento de los activos.
Acerca de SNCF Réseau
SNCF Réseau es una filial de la Société Nationale des Chemins de Fer Français (SNCF), la compañía nacional de ferrocarriles de Francia. SNCF Réseau opera y administra la infraestructura de la red ferroviaria de la SNCF, que consta de unos 32.000 km de líneas ferroviarias.
Beneficios de AWS
- Reducción del tiempo de implementación de la IA/ML de entre tres y seis meses a una semana
- Implementación del código en el nuevo sistema de ML en un plazo de dos semanas
- Reducción del tiempo de entrenamiento del modelo de tres días a diez horas
- Reducción de los tiempos de entrega de los proyectos de tres meses a menos de 48 horas
- Reducción de los costos de la ciencia de datos en un 71 %.
Servicios de AWS utilizados
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) es un servicio web que proporciona capacidad informática en la nube segura y de tamaño modificable. Está diseñado para facilitar a los desarrolladores la informática en la nube a escala web.
Instancias de spot de Amazon EC2
Las instancias de spot de Amazon EC2 permiten aprovechar la capacidad sin usar de EC2 en la nube de AWS. Las instancias de spot están disponibles con un descuento de hasta el 90 % en comparación con los precios bajo demanda.
Amazon SageMaker
Amazon SageMaker ayuda a los científicos de datos y a los desarrolladores a preparar, crear, entrenar e implementar con rapidez modelos de machine learning de alta calidad al poner a disposición un amplio conjunto de capacidades especialmente creadas para el ,machine learning.
Amazon EKS
Amazon Elastic Kubernetes Service (Amazon EKS) brinda la flexibilidad de iniciar, ejecutar y escalar aplicaciones de Kubernetes en la nube de AWS o en las instalaciones.
Introducción
Cada día crece el número de empresas de todos los tamaños y sectores que consiguen transformar sus negocios gracias a AWS. Contacte con nuestros expertos e inicie hoy mismo su proceso de traspaso a la nube de AWS.