Ogury e la sfida di soddisfare le necessità crescenti di analisi e ottimizzare i costi

Per rispondere all'esigenza di analizzare più dati senza aumentare i costi dell'infrastruttura, Ogury ha utilizzato le istanze EC2 Spot per ridurre i costi dei cluster EMR di Big Data del 57%.

Avvia un tutorial su Python
kr_quotemark
Fin dall'inizio a Ogury abbiamo sperimentato i limiti del precedente fornitore di servizi cloud e le relative problematiche di scalabilità. Il nostro prodotto viene distribuito su dispositivi telefonici mobili in tutto il mondo che, se non riescono a contattare i server, impediscono l'analisi dei dati da trasmettere per le campagne pubblicitarie. Il che è ovviamente un problema estremamente rilevante per il nostro sviluppo"
Olivier Bazoud
Head of infrastructure di Ogury

Ogury e la sfida di soddisfare le necessità crescenti di analisi e ottimizzare i costi

Il team desiderava calibrare l'infrastruttura mantenendo la velocità di sviluppo aziendale, i costi sotto controllo ed evitando la gestione dell'infrastruttura di base.

Dimensionamento e ottimizzazione dei costi in parallelo

Ogury analizza decine di terabyte al giorno, dai 400 milioni di profili in tutto il mondo che hanno acconsentito alla condivisione dei dati. Questi dati vengono filtrati, normalizzati e analizzati in un datalake. Le informazioni ottenute da queste analisi permettono l'attivazione della pubblicità. Di fronte all'esigenza di ottimizzazione dei costi relativi all'esecuzione di queste operazioni, Ogury si è affidata ad AWS per il dimensionamento. Nell'estate del 2015 Ogury ha migrato completamente ad AWS.

Con AWS tutto è sempre già pronto. Per esempio, abbiamo utilizzato in modo veramente veloce Amazon EMR. Stavamo cominciando ad analizzare grandi volumi di dati e abbiamo avuto bisogno di questo servizio per evitare di gestire per conto nostro i cluster di Big Data e risparmiare tempo", racconta Olivier Bazoud.
Ogury desiderava aumentare volumi e velocità senza incorrere in ingenti aumenti di costi, ecco perché ha scelto AWS. Per raggiungere questo obiettivo abbiamo lavorato molto sull'ottimizzazione dei servizi utilizzati.

Analizzare più dati senza aumentare i costi dell'infrastruttura

Amazon EMR permette a Ogury di analizzare i dati, con una prima fase di pulizia dei dati: pulire i dati, rimuovere i duplicati, normalizzare i dati e aggregarli. Successivamente, con il machine learning o le statistiche, Ogury deduce informazioni di alto livello come i gruppi di età, che permettono la targetizzazione delle campagne.

Tutti i dati, numerosi petabyte, vengono archiviati nel servizio gestito Amazon S3 che offre a Ogury un servizio affidabile e di facile utilizzo, poiché Amazon EMR legge direttamente da questo spazio di storage. I prodotti sono installati sulle istanze Amazon EC2, in microservizi o back-office. "L'utilizzo delle istanze Spot Amazon EC2 ci ha permesso di ottenere notevoli risparmi, con una riduzione dei costi dei cluster EMR di Big Data del 57%", spiega Olivier Bazoud.

Ogury raccoglie e analizza i dati del percorso dei clienti relativamente ai propri utenti combinando database noSQL Amazon DynamoDB per il consenso. "Lo utilizziamo come database gestito, per risparmiare tempo", racconta Olivier Bazoud. Possiamo concentrarci sul supporto agli sviluppatori senza dover ottimizzare il database. È accoppiato con il traffico, permettendoci il dimensionamento necessario a mantenere il carico".

Amazon Redshift è il data warehouse di Ogury: permette l'esecuzione di query sui dati, lo studio o la comprensione della targetizzazione delle campagne per determinati utenti (anonimi).

Infine, Ogury archivia i dati in Amazon S3 Glacier e utilizza le istanze riservate Amazon EC2 per ridurre i costi ancora una volta. "Abbiamo anche lavorato molto con AWS per ottimizzare i costi su Amazon Cloudfront . I dati che analizziamo utilizzano molta larghezza di banda per raggiungerci, producendo costi notevoli lungo il processo".

Velocità e miglioramento dei tempi di immissione sul mercato

"AWS ha supportato la nostra crescita. Sarebbe stato davvero complicato farlo senza di loro, soprattutto lo sarebbe stato ancora di più farlo da soli e in locale, ad esempio. Non avremmo ottenuto la stessa velocità di implementazione. Tuttavia, lo sviluppo dell'azienda è stato molto veloce, dovevamo sostenerlo con l'infrastruttura. Solo AWS era in grado di aiutarci, "ha dichiarato Olivier Bazoud.

Ogury sta anche migliorando il tempo di immissione sul mercato. Circa un centinaio di dipendenti lavorano in R&D, con un prodotto basato sulla tecnologia. "Utilizzare AWS ci permette di crescere più velocemente rispetto ai nostri concorrenti. Ciò significa miglioramento continuo, in modalità agile. Il team di sviluppo rilascia nuove funzionalità ogni due settimane o più. " Per Olivier Bazoud, Ogury ha bisogno della velocità di risposta dei servizi AWS.

Mantenere gli obiettivi di crescita grazie a un'infrastruttura solida
"Il team è piuttosto piccolo per gestire questa infrastruttura in 4 regioni con moli di traffico notevoli. AWS ci permette in tutta tranquillità di gestire e supportare la crescita e il dimensionamento di Ogury. Non c'è stato nemmeno un momento in cui l'infrastruttura ha rallentato la crescita dell'azienda. Non è più un ostacolo allo sviluppo di un'azienda come avveniva con i vecchi modelli, o prima che ci fosse il cloud e lo sviluppo avveniva in pochi mesi. Se Ogury ha le dimensioni e la crescita che possiamo vedere oggi, è perché l'infrastruttura ha resistito a questa crescita esponenziale".


Ulteriori informazioni su Ogury

Ogury è l'azienda leader mondiale per la pubblicità di branding per i dispositivi mobili.. Creata nel 2014, questa startup di Adtech ora è attiva in 10 paesi e ha più di 400 dipendenti. Lavora con più di 1 milione e mezzo di marchi e 3,500 editori per creare un ecosistema pubblicitario digitale affidabile basato sulle scelte degli utenti. Il motore pubblicitario di Ogury è un set di tecnologie integrato, dalla gestione del consenso al coinvolgimento, progettato e ottimizzato per le campagne di branding per dispositivi mobili.

Riepilogo

Amazon EMR

Amazon EMR è la piattaforma basata sul cloud di Big Data leader del settore per l'elaborazione di grandi quantità di dati tramite strumenti open source come Apache Spark, Apache Hive, Apache HBase, Apache Flink, Apache Hudi e Presto.

Ulteriori informazioni

Amazon S3

Amazon Simple Storage Service (Amazon S3) è un servizio di storage di oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore.

Ulteriori informazioni

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) è un servizio Web che fornisce capacità di elaborazione sicura e scalabile nel cloud. Rivolto agli sviluppatori è progettato per facilitare l'accesso alle risorse di cloud computing su scala Web.

Ulteriori informazioni

Amazon DynamoDB

Amazon DynamoDB è un database che supporta i modelli di dati di tipo documento e di tipo chiave-valore che offre prestazioni di pochi millisecondi a qualsiasi scala.

Ulteriori informazioni