Ogury et le défi de répondre à des besoins d’analyse croissants en optimisant les coûts

Pour répondre au défi d’analyser plus de données sans faire exploser les coûts d’infrastructure, Ogury a utilisé des instances Spot EC2 ce qui lui a permis de réduire les coûts des clusters big data EMR de 57%.

start a python tutorial
kr_quotemark
Dès les débuts d’Ogury, nous avons très vite expérimenté les limites de notre ancien fournisseur de cloud et avons été confrontés à des problématiques de scale. Notre produit se déploie sur les téléphones mobiles dans le monde entier, et s’ils n’arrivent pas à contacter nos serveurs, nous ne pouvons pas analyser et étudier les données pour diffuser nos campagnes de publicité. Ce qui est bien sûr un frein pour notre développement"
Olivier Bazoud
Head of infrastructure chez Ogury

Ogury et le défi de répondre à des besoins d’analyse croissants en optimisant les coûts

L’équipe souhaitait mettre à l’échelle leur infrastructure en suivant le développement très rapide de l’entreprise tout en maîtrisant les coûts et en se libérant de la gestion basique de l’infrastructure.

Quand le scaling et l’optimisation des coûts vont de pair

Ogury analyse des dizaines de téra de données mobiles chaque jour, provenant de 400 millions de profils dans le monde entier ayant consenti à partager ces données. Ces dernières sont filtrées, normalisées, et analysées dans un datalake. Les enseignements tirés de ces analyses permettent de faire de l’activation publicitaire. Confrontée au besoin d’optimiser le coût de fonctionnement de ces actions, tout en scalant, Ogury s’est tournée vers AWS. À l’été 2015, Ogury avait complètement migré chez AWS.

« Avec AWS, tout est déjà prêt. Nous avons par exemple très vite utilisé Amazon EMR. Nous commencions à analyser un gros volume de données, et nous avions besoin de ce service pour éviter de manager nous-même des clusters big data et gagner du temps », précise Olivier Bazoud.
En passant chez AWS, Ogury souhaitait faire beaucoup plus en vitesse et volume, sans augmenter les dépenses proportionnellement. Un gros travail d’optimisation des services utilisés leur a permis d’atteindre cet objectif.

Analyser plus de datas, sans faire exploser les coûts d’infrastructure

Amazon EMR permet à Ogury d’analyser les données, avec une première étape de data cleaning : nettoyer les données, enlever les doublons, normaliser les datas, les agréger. Dans un second temps, avec du machine learning ou des statistiques, Ogury déduit des informations de plus haut niveau, comme des classes d’âges, qui vont aider pour le ciblage des campagnes.

Toutes les données, soit plusieurs péta, sont stockées dans Amazon S3 en service managé, ce qui assure à Ogury un service fiable, et une certaine facilité d’utilisation puisque Amazon EMR lit directement dans cet espace de stockage. Les produits sont installés sur des instances Amazon EC2, en microservices ou back-office. « L’utilisation d’instances Spot Amazon EC2 nous a permis de réaliser des économies conséquentes, en réduisant les coûts de nos clusters big data EMR de 57 % ! », relève Olivier Bazoud.

Ogury collecte et analyse la donnée de parcours client de leurs utilisateurs en combinant avec des bases noSQL Amazon DynamoDB pour le consentement. « Nous nous en servons comme d’une base de données managée, ce qui nous fait gagner du temps, explique Olivier Bazoud. Nous pouvons nous concentrer sur l’aide aux développeurs, sans avoir à optimiser la base de données. Elle est jumelée au trafic, ce qui permet de scaler pour tenir la charge ».

Amazon Redshift est le datawarehouse d’Ogury, et permet d’interroger ces datas, de réaliser des études ou de connaître le ciblage des campagnes pour certains utilisateurs (qui sont anonymisés).

Enfin, Ogury archive ses datas sur Amazon S3 Glacier et utilise les instances réservées Amazon EC2 pour, là encore, réduire les coûts. « Nous avons aussi beaucoup travaillé avec AWS pour optimiser les coûts sur Amazon Cloudfront. Les datas que nous analysons utilisent beaucoup de bande passante pour arriver chez nous, et cette dernière a un coût non négligeable dans le processus ».

Réactivité et amélioration du time to market

« AWS nous a accompagnés dans notre scale. Ça aurait été compliqué de faire sans eux et encore plus compliqué de le faire nous-même sur du on premise par exemple. Nous n’aurions pas eu la même rapidité de mise en œuvre. Or le développement de l’entreprise est allé très vite, il fallait suivre au niveau de l’infrastructure. Il n’y avait qu’AWS pour tenir la cadence », estime Olivier Bazoud.

Ogury améliore par ailleurs son time to market. Une centaine de salariés travaillent en R&D, avec un produit dont le cœur est basé sur la tech. « Utiliser AWS nous permet d’aller plus vite que nos concurrents. C’est de l’amélioration permanente, on est en mode agile. L’équipe de développement sort de nouvelles fonctionnalités tous les 15 jours, voire plus ». Pour Olivier Bazoud, Ogury a besoin de la réactivité des services AWS.

Tenir les objectifs de croissance grâce à une infrastructure solide
« Pour gérer cette infrastructure sur 4 régions, avec un énorme trafic, l’équipe est assez restreinte. Nous accompagnons la croissance et le scale d’Ogury, et c’est ce qu’AWS nous permet de faire sereinement. Il n’y a pas eu un moment où l’infrastructure a ralenti la croissance de l’entreprise. Elle n’est plus un frein au développement d’une entreprise comme cela peut être le cas avec d’anciens modèles, ou avant qu’il n’y ait le cloud et que le déploiement se comptait en mois. Si Ogury a le scale et la croissance que l’on constate aujourd’hui, c’est parce que l’infrastructure a tenu le choc par rapport à cette croissance exponentielle ».


À propos d'Ogury

Ogury est le leader mondial de la publicité branding sur mobile. Créée en 2014, cette startup de l’Adtech est désormais présente dans 10 pays et emploie plus de 400 salariés. Elle travaille avec plus de 1500 marques et 3500 éditeurs pour établir un écosystème de publicité digitale digne de confiance, basé sur le choix de l’utilisateur. Ogury Advertising Engine est un ensemble intégré de technologies, de la gestion de consentement à l’engagement, conçu et optimisé pour les campagnes de branding sur mobile.

Bilan

Amazon EMR

Amazon EMR est une plateforme leader de Big Data dans le cloud dédiée au traitement de grandes quantités de données à l'aide d'outils à code source libre tels que Apache Spark, Apache Hive, Apache HBase, Apache Flink, Apache Hudi et Presto.

En savoir plus »

Amazon S3

Amazon Simple Storage Service (Amazon S3) est un service de stockage d'objet offrant une évolutivité, une disponibilité des données, une sécurité et des performances de pointe.

En savoir plus »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) est un service Web qui fournit une capacité de calcul sécurisée et redimensionnable dans le cloud. Destiné aux développeurs, il est conçu pour faciliter l'accès aux ressources de cloud computing à l'échelle du Web.

En savoir plus »

Amazon DynamoDB

Amazon DynamoDB est une base de données de clé-valeur et de documents, offrant des performances de latence de l'ordre de quelques millisecondes, quelle que soit l'échelle.

En savoir plus »