La maggior parte delle soluzioni concorrenti di data warehousing sarebbero costate fino a 1 milione di dollari l'anno. Amazon Redshift ci è invece costato solo 100.000 dollari, tutto compreso, con un risparmio complessivo di circa il 90%. 
Joel Cumming Responsabile dati

Nel 2009, un gruppo di studenti talentuosi dell'Università di Waterloo, in Canada, ha creato Kik Interactive. Kik Messenger, il servizio di messaggistica dell'azienda, è oggi utilizzato da oltre 275 milioni di abbonati, soprattutto negli Stati Uniti. Oltre a offrire gratuitamente una serie di funzionalità di messaggistica tramite testo, immagini e video, Kik Messenger vanta un browser integrato per ricercare e accedere ai contenuti Web. Il servizio offre inoltre strumenti per gli sviluppatori che consentono alle organizzazioni di ottimizzare e distribuire i loro contenuti Web sulla sua piattaforma.

Per preservare gli abbonati esistenti e stimolare una crescita sostenibile, Kik deve assicurare un servizio di messaggistica che sia veloce, reattivo e sempre disponibile. Chris Fairles, responsabile del team Kik DevOps, ha dichiarato “I nostri abbonati dipendono da noi per consegnare i loro messaggi in tempo reale ed è nostra responsabilità non deludere le loro aspettative. Per offrire i nostri servizi al miglior livello possibile, investiamo in tecnologie sufficientemente affidabili, sicure e flessibili da soddisfare le esigenze in costante evoluzione dei nostri abbonati.”

Un'ulteriore sfida di Kik consiste nell'ascoltare i propri abbonati e accertarsi che le loro esigenze siano soddisfatte offrendo gli ultimi miglioramenti dei prodotti. “Abbiamo a disposizione tantissimi dati sui nostri clienti e su come utilizzano i nostri servizi ma spesso sono nascosti in file di registro o altri sistemi all'interno dell'azienda”, ha dichiarato Fairles. “Per convertire questi dati in informazioni aziendali utili e per assicurare che tutte le nostre decisioni di sviluppo si basino su dati concreti, stiamo investendo molto nelle tecniche e tecnologie di Big Data di ultima generazione.”

Per offrire la migliore esperienza possibile agli abbonati, Kik utilizza una serie di server interni e infrastrutture in hosting sul cloud Amazon Web Services (AWS). Fairles ha dichiarato “Utilizziamo AWS per offrire una gamma di funzionalità ai nostri utenti, tra cui immagini del profilo, messaggistica con immagini, video messaggi e gestione dell'account.”

L'architettura AWS di Kik integra Amazon Elastic Compute Cloud (Amazon EC2), Amazon Simple Storage Service (Amazon S3) ed Amazon Virtual Private Cloud (Amazon VPC), oltre al servizio Amazon CloudFormation utilizzato per effettuare il provisioning e distribuire on demand l'infrastruttura basata sul cloud. “Grazie ad AWS CloudFormation, abbiamo adottato quella che chiamiamo un'architettura di “microservizi”, dove tutta la nostra infrastruttura AWS è definita come codice”, ha dichiarato Fairles. “A breve adotteremo anche Amazon CodeDeploy, che ci consentirà di accelerare in maniera rapida e veloce gli stack IT standardizzati, con interventi manuali praticamente inesistenti.”

AWS ha inoltre consentito a Kik di offrire agli abbonati un servizio veloce e reattivo. “Utilizziamo Amazon Direct Connect per velocizzare lo scambio di dati tra la nostra farm di server interna e il cloud AWS, che riduce al minimo la latenza e il tremolio”, ha affermato Fairles. “Utilizziamo anche Amazon CloudFront e Amazon Route 53 per distribuire contenuti agli edge point più vicini agli abbonati, che rendono la nostra applicazione super veloce e reattiva, ovunque si trovino gli utenti.”

Utilizzando l'architettura di microservizi, Kik ha inoltre creato una piattaforma sofisticata di analisi dei dati su AWS per offrire nuovi approfondimenti a valore aggiunto all'azienda e ottimizzare l'esperienza degli abbonati. Questa piattaforma si basa su Amazon EC2, Amazon S3 ed Amazon VPC, oltre ad Amazon Redshift che fornisce la funzionalità principale di data warehousing.

I dati per le attività di analisi provenivano originariamente da centinaia di terabyte di dati di file di registro che erano precedentemente archiviati nei bucket Amazon S3. Per comprimere ed elaborare i file di registro prima che fossero caricati in Amazon Redshift, dove sono stati ulteriormente compressi, sono stati utilizzati gli script di Amazon Elastic Map Reduce (Amazon EMR) e Hadoop Pig. “Dai nostri 500 terabyte iniziali, oggi gestiamo 50 terabyte di dati e il nostro lavoro è decisamente più semplice.”  

L'infrastruttura AWS di Kik, che incorpora Auto Scaling, consente all'azienda di offrire servizi di messaggistica e altri contenuti in maniera economicamente più vantaggiosa e di pagare solo in base alle risorse di calcolo e storage effettivamente utilizzate. “La nostra architettura AWS viene scalata automaticamente durante i periodi di picco e ritorna ai parametri iniziali nei periodi meno intensi” ha affermato Fairles. “Ciò significa che paghiamo solo in base alle risorse di calcolo e storage che utilizziamo, rendendo in questo modo molto più redditizia la nostra attività.”

Con AWS, l'azienda è inoltre riuscita a ottimizzare la disponibilità del servizio per gli abbonati. “Ogni componente della nostra architettura AWS è completamente ridondante, il che significa che possiamo mantenere i servizi online anche in caso di importanti guasti a livello tecnologico,” ha dichiarato Fairles. “Utilizziamo inoltre diverse zone di disponibilità in AWS per essere certi che la nostra applicazione sia sempre disponibile per gli abbonati, anche nel caso in cui un intero data center AWS dovesse diventare non disponibile.”  

Amazon Redshift consente a Kik Interactive di accedere a preziosi approfondimenti commerciali sui propri clienti e dati operativi. Joel Cumming, responsabile dati di Kik, ha dichiarato “Possiamo vedere in che modo differenti tipi di utenti utilizzano i nostri servizi e identificarne le esigenze e le preferenze. Possiamo quindi utilizzare questi dati approfonditi per definire nuovi progetti di sviluppo, risolvere problematiche del servizio, esplorare nuovi mercati, offrire un'esperienza personalizzata e ridurre al minimo il tasso di abbandono dei clienti.”

Ottenere questi dati approfonditi è molto meno costoso con Amazon Redshift, poiché non implica requisiti hardware, software e di assistenza interni. “La maggior parte delle soluzioni concorrenti di data warehousing sarebbe costata fino a 1 milione di dollari l'anno, tenendo conto dei costi di acquisto e di manutenzione e supporto ricorrenti,” ha dichiarato Cumming. “Amazon Redshift ci è invece costato solo 100.000 dollari, tutto compreso, con un risparmio complessivo di circa il 90%.”

Recentemente, un aggiornamento hardware Redshift a costo zero ha consentito a Kik di incrementare del 30% le prestazioni del data warehousing. “AWS aggiorna continuamente la sua piattaforma, consentendoci di offrire maggiori approfondimenti all'azienda in maniera più rapida rispetto al passato,” ha dichiarato Cumming. “Di conseguenza, possiamo raccogliere più dati da maggiori fonti e acquisire nuove informazioni sulle esigenze dei clienti, il tutto con minori risorse.”

Recentemente, Kik ha distribuito AWS Lambda, che Cumming descrive come la “prossima frontiera” per l'analisi dei dati all'interno dell'azienda. “Siamo entusiasti,” ha dichiarato. “AWS Lambda effettua automaticamente il provisioning dell'infrastruttura che dobbiamo eseguire sulle nostre applicazioni scientifiche, senza il nostro intervento. Anziché sprecare tempo a gestire i server, possiamo focalizzarci così su quello che sappiamo fare meglio: offrire informazioni approfondite all'azienda e migliorare l'esperienza per i nostri utenti.”

Oltre ad AWS Lambda, Kik sta utilizzando Amazon API Gateway e Amazon DynamoDB, che offrono al servizio interno dell'azienda l'accesso immediato ai dati di cui hanno bisogno. “API Gateway ci ha consentito di far emergere molto rapidamente complessi modelli statistici e personalizzazione all'interno del nostro prodotto,” ha dichiarato Cumming. “Abbiamo creato la prima iterazione del nostro Data API interno su DynamoDB, Lambda e API Gateway in maniera estremamente rapida e ora i servizi all'interno di Kik possono essere personalizzati e scalati in un modo che non sarebbe stato possibile in passato.”

Per ulteriori informazioni su come AWS può aiutare a ridurre il costo di gestione dei dati, visitare la pagina Dettagli di Big Data.