La mayoría de las demás soluciones de almacenamiento de datos nos costarían hasta 1 millón de USD al año. En cambio, la solución completa de Amazon Redshift nos cuesta tan solo 100 000 USD, lo que representa un ahorro total en los costos del 90%.  
Joel Cumming Jefe de datos

En 2009, un grupo de alumnos con talento de la Universidad de Waterloo de Canadá crearon Kik Interactive. Más de 275 millones de suscriptores utilizan el servicio de mensajería de la compañía, Kik Messenger, principalmente en los EE.UU. Además de proporcionar funciones de mensajería de texto, imágenes y vídeo gratuitas, Kik Messenger incorpora un navegador para buscar y acceder a contenido web. Kik también proporciona herramientas para desarrolladores que permiten a las organizaciones optimizar y distribuir su contenido web a los suscriptores de su plataforma.  

Para conservar los suscriptores actuales e impulsar un crecimiento sostenible, Kik debe asegurarse de disponer de un servicio de mensajería rápido, con buena capacidad de respuesta y que esté disponible constantemente. Chris Fairles, director del equipo de operaciones de desarrollo de Kik, afirma: “Nuestros suscriptores dependen de nosotros y de que enviemos los mensajes en tiempo real en todo momento, una responsabilidad que nos tomamos muy en serio. Para conseguir que nuestros servicios sean lo mejor posible, invertimos en tecnologías lo suficientemente fiables, seguras y flexibles como para satisfacer las cambiantes necesidades de los suscriptores”.

Como reto adicional, Kik debe escuchar a los suscriptores y asegurarse de satisfacer sus necesidades con las mejoras a los productos más recientes. “Poseemos una gran cantidad de datos acerca de los clientes y de cómo utilizan nuestros servicios, pero a menudo se encuentran en archivos de registro u otros sistemas de la compañía”, explica Fairles. “Para convertir estos datos en verdaderos conocimientos empresariales y asegurarnos de que todas nuestras decisiones de desarrollo se basan en pruebas válidas, estamos invirtiendo significativamente en las técnicas y tecnologías de big data más recientes”.

Para proporcionar la mejor experiencia a los suscriptores, Kik utiliza una combinación de servidores en las instalaciones e infraestructura alojada en la nube de Amazon Web Services (AWS). Fairles asegura: “Utilizamos AWS para proporcionar una variedad de funciones a nuestros usuarios, desde fotos de perfil y mensajes con imágenes a mensajería de vídeo y administración de cuentas”.

La arquitectura de AWS de Kik incorpora Amazon Elastic Compute Cloud (Amazon EC2), Amazon Simple Storage Service (Amazon S3) y Amazon Virtual Private Cloud (Amazon VPC), con Amazon CloudFormation para aprovisionar e implementar infraestructura basada en la nube bajo demanda. “Con AWS CloudFormation, hemos adoptado lo que llamamos una arquitectura ‘microondas’, en la que toda nuestra infraestructura de AWS está definida como código”, explica Fairles. “En un futuro cercano, también adoptaremos Amazon CodeDeploy, que nos permitirá poner en marcha pilas de TI estandarizadas de forma rápida y sencilla prácticamente sin esfuerzo manual”.

Gracias a AWS, Kik también puede proporcionar una experiencia de servicio rápida y con excelente capacidad de respuesta a los suscriptores. “Utilizamos Amazon Direct Connect para acelerar el intercambio de datos entre nuestra granja de servidores interna y la nube de AWS, lo que minimiza la latencia y la vibración”, comenta Fairles. “También utilizamos Amazon CloudFront y Amazon Route 53 para proporcionar contenido a los extremos más cercanos a los suscriptores, lo que aporta una gran rapidez y capacidad de respuesta a nuestra aplicación independientemente de donde estén los usuarios”.

Con la arquitectura microondas, Kik también ha creado una plataforma de análisis de datos sofisticada en AWS que proporciona información nueva y de valor añadido a la empresa y optimiza la experiencia de los suscriptores. Esta estructura utiliza Amazon EC2, Amazon S3 y Amazon VPC, conAmazon Redshift como función de almacenamiento de datos principal.

Los datos de origen de las actividades de análisis procedían originariamente de cientos de terabytes de datos de archivos de registros almacenados anteriormente en depósitos de Amazon S3. Se utilizaron Amazon Elastic Map Reduce (Amazon EMR) y scripts Hadoop Pig para resumir y procesar los archivos de registros antes de cargarlos a Amazon Redshift, donde se comprimieron todavía más. “Desde que empezamos con 500 terabytes, ahora tenemos 50 terabytes bajo control, que nos facilita muchísimo las cosas”.  

La infraestructura de AWS de Kik, que incorporaAuto Scaling, permite a la compañía proporcionar servicios de mensajería y otro contenido de forma mucho más rentable y pagar solo por los recursos informáticos y de almacenamiento que necesita. “Nuestra arquitectura de AWS se escala automáticamente durante las horas pico de tráfico, y se reduce también automáticamente cuando todo está más tranquilo”, explica Fairles. “Eso significa que solo pagamos por los recursos informáticos y de almacenamiento que necesitamos, lo que nos aporta mucha mayor rentabilidad que de otro modo”.

Kik también ha podido optimizar la disponibilidad del servicio para los suscriptores gracias a AWS. “Todos los componentes de nuestra arquitectura de AWS son totalmente redundantes, por lo que podemos mantener los servicios online incluso si se produce un fallo tecnológico grave”, asegura Fairles. “Además, utilizamos varias zonas de disponibilidad de AWS para garantizar que la aplicación esté siempre disponible para los suscriptores, incluso si todo un centro de datos de AWS dejara de estar disponible”.  

Gracias a Amazon Redshift, Kik Interactive puede extraer información valiosa de los datos operativos y de clientes. Joel Cumming, director de datos de Kik, afirma: “Podemos ver cómo distintos tipos de usuarios se involucran con nuestros servicios e identifican sus necesidades y preferencias. A continuación, podemos utilizar esta información para crear nuevos proyectos de desarrollo, resolver problemas con el servicio, dirigirnos a otros mercados, proporcionar una experiencia personalizada y reducir el abandono de los clientes”.

Obtener esta información resulta mucho más económico con Amazon Redshift, que elimina los requisitos de hardware, software y soporte en las instalaciones. “La mayoría de las demás soluciones de almacenamiento de datos nos costarían hasta 1 millón de USD al año, teniendo en cuenta los costos de la compra y del mantenimiento y soporte constantes”, explica Cumming. “En cambio, la solución completa de Amazon Redshift nos cuesta tan solo 100 000 USD, lo que representa un ahorro total en los costos del 90%”.

Recientemente, una mejora de hardware de Redshift gratuita permitió a Kik lograr un incremento del 30% en el desempeño del almacenamiento de datos. “AWS mejora su plataforma constantemente, lo que nos permite disponer de más información en la empresa con mayor rapidez que antes”, afirma Cumming. “Como resultado, podemos recopilar más datos de más fuentes y obtener más información acerca de las necesidades de los clientes, todo ello con menos recursos”.

Recientemente, Kik ha implementado AWS Lambda, que Cumming describe como la “siguiente frontera” del análisis de datos para la compañía. “Estamos entusiasmados”, asegura. “AWS Lambda aprovisiona la infraestructura necesaria para ejecutar nuestras aplicaciones de datos científicos para que nosotros no tengamos que hacerlo. En lugar de dedicar tiempo a mantener los servidores, podemos concentrarnos en lo que hacemos mejor: proporcionar información a la empresa y mejorar la experiencia para nuestros usuarios”.

Además de AWS Lambda, Kik utiliza Amazon API Gateway y Amazon DynamoDB, que aportan a los servicios internos de la compañía acceso a los datos que necesitan. “API Gateway nos ha permitido incorporar modelos estadísticos y personalización complejos a nuestro producto”, afirma Cumming. “Creamos la primera iteración de nuestra API de datos interna en DynamoDB, Lambda, y API Gateway con gran rapidez, gracias a lo cual los servicios de Kik se pueden personalizar y escalar de un modo que antes no era posible”.

Para obtener más información acerca de cómo AWS puede ayudarle a reducir los costos de la administración de datos, visite nuestra página de detalles sobre big data.