100_bmw-group-logo

BMW Group sfrutta al meglio la potenza dei dati con un data lake basato su AWS

2020

Con sede a Monaco, in Germania, BMW Group annovera quattro marchi (BMW, BMW Motorrad, MINI e Rolls-Royce) ed è uno dei costruttori di automobili e motociclette più importanti del mondo. Fornisce inoltre servizi finanziari e di mobilità premium.

Negli ultimi anni, BMW Group si è impegnato a rimanere in prima linea nella trasformazione digitale del settore automobilistico utilizzando i dati e l'analisi predittiva. Kai Demtröder, vicepresidente delle piattaforme di trasformazione dei dati, intelligenza artificiale, dati e DevOps di BMW Group, ha affermato: "Per rimanere innovativi, ci stiamo concentrando sulla creazione di nuove esperienze, digitali e connesse, e sulla promozione del cambiamento nella nostra catena del valore, al fine di migliorare sia l'efficienza che l'efficacia grazie a decisioni basate sui dati. Per consentire queste innovazioni, nel 2015 BMW Group ha creato un data lake centralizzato e on-premise che raccoglie e combina dati anonimizzati provenienti da sensori all'interno dei veicoli, sistemi operativi e data warehouse per ottenere informazioni cronologiche, in tempo reale e predittive.

L'azienda, tuttavia, aveva bisogno di ricalibrare in modo semplice il proprio data lake per supportare le crescenti richieste degli stakeholder interni ed esterni. A causa della difficoltà di accedere a dati disseminati in numerosi ambienti isolati, l'innovazione di BMW Group era rallentata dall'infrastruttura IT in uso e dai lunghi tempi necessari per supportare nuove iniziative. BMW Group aveva bisogno di sviluppare una soluzione abbastanza agile da supportare le esigenze in termini di dati delle varie unità di business interne e consentire all'azienda di gestire in modo rapido la serie di casi d'uso emergenti richiesti dai propri clienti.

BMW Group desiderava anche offrire ai data consumer l'accesso in tempo reale ai dati telemetrici dei veicoli quali, ad esempio, la velocità, la posizione, la temperatura, il livello della batteria e dei freni e lo stato del motore. Desiderava inoltre integrare nel data lake funzionalità di analisi e machine learning per accelerare lo sviluppo di nuovi servizi innovativi. Come prerequisito di base, la soluzione doveva anche fornire la governance necessaria per garantire la conformità alle normative in materia di privacy e sicurezza.

BMW iX
kr_quotemark

La collaborazione con AWS è appena iniziata, ma siamo impazienti di aiutare la nostra azienda a realizzare la sua strategia di proiettare l'innovazione verso il futuro."

Kai Demtröder
Vicepresidente delle piattaforme di trasformazione dei dati, intelligenza artificiale, dati e DevOps
BMW Group

Adozione di un approccio basato sui dati

Per rispondere a queste sfide, BMW Group ha deciso di riprogettare e trasferire il suo data lake on-premise nel cloud di Amazon Web Services (AWS). Il Cloud Data Hub (CDH) di BMW Group elabora e combina dati anonimizzati raccolti da sensori di veicoli e da altre origini all'interno dell'organizzazione per renderli facilmente accessibili ai team aziendali che creano applicazioni interne e rivolte ai clienti. L'azienda ha constatato che AWS offriva l'agilità e la flessibilità di cui aveva bisogno, oltre alla portata necessaria per supportare utenti in tutto il mondo.

Prima della migrazione, il rigido data lake on-premise di BMW Group non riusciva a soddisfare le esigenze in costante crescita degli ingegneri e degli analisti dei dati. Il precedente data lake, che eseguiva flussi di lavoro interdipendenti, non era in grado di gestire efficacemente più tenant e, di conseguenza, i team responsabili della piattaforma, dell'acquisizione dei casi d'uso di BMW Group richiedevano un coordinamento complesso per lavorare ai progetti e si imbattevano in colli di bottiglia organizzativi che rallentavano i processi.

BMW Group ha deciso di affidarsi ad alcuni servizi gestiti di AWS, tra cui Amazon Athena, Amazon Simple Storage Service (Amazon S3), Amazon Kinesis Data Firehose e AWS Glue per ridurre la complessità della configurazione differenziando i componenti e creare un ambiente scalabile per soddisfare le esigenze degli ingegneri dei dati. Ciò ha anche consentito ai team di gestire ogni fase del processo DevOps, ottenendo l'autonomia e l'agilità necessarie per continuare a innovare.

BMW Group ha implementato anche un moderno portale Web, che aiuta gli utenti del CDH a rilevare set di dati affidabili utilizzando un algoritmo di ricerca avanzato e ad eseguire query dei dati in modo semplice per ottenere nuove informazioni.

Democratizzazione dell'utilizzo dei dati su vasta scala

BMW Group utilizza i servizi AWS per acquisire vaste quantità di dati ogni giorno. Attualmente, milioni di veicoli BMW e MINI sono collegati al CDH tramite il back-end estremamente sicuro di BMW Group e ogni giorno vengono elaborati terabyte di dati telemetrici anonimi. L'azienda utilizza questi dati per monitorare gli indicatori dello stato dei veicoli, ad esempio verificare gli errori dei controlli per individuare potenziali problemi in tutte le linee di veicoli. Ciò permette a BMW Group di sfruttare i dati relativi al parco veicoli acquisiti, raccolti e perfezionati dal CDH per risolvere i problemi in modo più efficace e prima che abbiano un impatto sui clienti.

Per gestire meglio questi dati, BMW Group ha introdotto le figure dei "fornitori di dati" e dei "data consumer" per migliorare l'autonomia e l'agilità dei team addetti alla progettazione di software. I fornitori di dati acquisiscono e trasformano i dati utilizzando servizi AWS come Amazon Kinesis Data Firehose, AWS Lambda, AWS Glue e Amazon EMR. I data consumer possono quindi utilizzare servizi come Amazon Athena, Amazon SageMaker, AWS Glue e Amazon EMR per utilizzare i dati per i propri casi d'uso. Sia i fornitori di dati che i data consumer utilizzano questi servizi nei propri account e condividono soltanto interfacce ben definite che possono essere controllate da un'API centrale, aiutando a prevenire i colli di bottiglia. I singoli layer dei dati vengono memorizzati in bucket Amazon S3, mentre i relativi schemi vengono registrati nel catalogo dati di AWS Glue.

BMW Group ha compreso che, oltre a raccogliere metadati tecnici nel catalogo dati di AWS Glue, doveva creare un catalogo di dati leggibili per favorire la democratizzazione dei dati all'interno dell'organizzazione. Ciò avrebbe garantito un elevato livello di trasparenza relativa agli asset di dati raccolti nel CDH e alle modalità di raccolta. L'applicazione front-end Data Portal funge da strumento di esplorazione dei dati per migliorare la produttività degli analisti dei dati, dei data scientist e degli ingegneri dei dati grazie alla possibilità di visualizzare chiaramente le risorse di dati e all'offerta di un "indice di popolarità" basato sui modelli di utilizzo dei dati per più di 500 utenti in tutta l'organizzazione.

Inoltre, il CDH sfrutta GraphQL tramite AWS AppSync per creare API scalabili e universali per fornitori di dati e data consumer, migliorando la flessibilità dello sviluppo. A differenza delle tradizionali API REST, le interfacce basate su GraphQL sono adatte a supportare requisiti evolutivi, come la rappresentazione dei metadati per il catalogo dei dati o la fornitura di dati eterogenei raccolti da veicoli connessi. Gli sviluppatori hanno la flessibilità di definire la struttura del payload e i parametri delle query per ottenere i dati di cui hanno bisogno per un determinato caso d'uso. Ciò li aiuta a creare applicazioni in modo molto più rapido rispetto a prima, perché non devono più creare un nuovo set di API per ogni progetto con un diverso set di requisiti dei dati.

Accelerazione dell'innovazione

Il data lake centralizzato e basato su AWS rappresenta il punto nevralgico di BMW Group per lo sviluppo di soluzioni IT basate sui dati e consente all'azienda di ricalibrare le proprie risorse in modo automatico e indipendente su un'architettura serverless. In questo modo, BMW Group è in grado di innovare in tempi più rapidi rispetto a quando utilizzava la precedente soluzione on-premise, che richiedeva operazioni di gestione dell'infrastruttura e di pianificazione della capacità per ogni nuova iniziativa.

BMW Group renderà disponibili in modalità open source i componenti principali relativi al CDH, tra cui le API, l'architettura e il Data Portal. Ciò è ulteriormente incoraggiato dal fatto che BMW Group è uno dei primi membri di Gaia-X, l'iniziativa europea per la creazione di spazi di dati sovrani. 

Per quanto riguarda il futuro, BMW Group continuerà a incrementare le capacità della piattaforma CDH per accelerare ulteriormente la sua trasformazione digitale e apportare valore aggiuntivo in tutta l'azienda, offrendo esperienze innovative ai clienti, nuovi servizi di mobilità e informazioni aziendali interne. Demtröder conclude affermando che: "La collaborazione con AWS è appena iniziata, ma siamo impazienti di aiutare la nostra azienda a realizzare la sua strategia di proiettare l'innovazione verso il futuro".

Per ulteriori informazioni, visita aws.amazon.com/automotive.

Figura 1: Panoramica dell'architettura CDH

Figura 1: Panoramica dell'architettura CDH

Figure 2: Vista del portale CDH

Figure 2: Vista del portale CDH

Informazioni su BMW Group

Con i suoi quattro marchi (BMW, MINI, Husqvarna Motorcycles e Rolls-Royce), BMW Group è uno dei costruttori di automobili e motociclette più importanti del mondo. L'azienda offre inoltre servizi finanziari e di mobilità premium.

Vantaggi di AWS

  • Democratizzazione dell'utilizzo dei dati su vasta scala
  • Elaborazione quotidiana di terabyte di dati provenienti da milioni di veicoli
  • Risoluzione dei problemi prima che abbiano un impatto sui clienti
  • Accelerazione dell'innovazione

Servizi AWS utilizzati

Amazon Kinesis Data Firehose

Amazon Kinesis Data Firehose è il mezzo più semplice per caricare in modo affidabile flussi di dati in data lake, datastore e servizi di analisi. Può acquisire, trasformare e distribuire flussi di dati su Amazon S3, Amazon Redshift, Amazon Elasticsearch Service, endpoint HTTP generici e fornitori di servizi come Datadog, New Relic, MongoDB e Splunk.

Ulteriori informazioni »

Amazon SageMaker

Amazon SageMaker è un servizio completamente gestito che consente a data scientist e sviluppatori di creare, addestrare e distribuire modelli di machine learning in modo rapido. SageMaker semplifica le fasi del processo di machine learning per sviluppare modelli di alta qualità in modo più facile.

Ulteriori informazioni »

AWS AppSync

AWS AppSync è un servizio completamente gestito che facilita lo sviluppo di API GraphQL gestendo le attività impegnative derivanti dalla connessione sicura a origini dati come AWS DynamoDB, Lambda e altro. Una volta distribuito, AWS AppSync ricalibra automaticamente il motore di esecuzione dell'API GraphQL per soddisfare i volumi di richieste API.

Ulteriori informazioni »

AWS Glue

AWS Glue è un servizio di estrazione, trasformazione e caricamento (ETL) che semplifica la preparazione e il caricamento dei dati per le attività di analisi.

Ulteriori informazioni »


Inizia subito anche tu

Aziende di tutte le dimensioni e di tutti i settori stanno trasformando ogni giorno la propria attività grazie ad AWS. Contatta i nostri esperti e comincia subito il tuo percorso verso AWS Cloud.