CNA moderniza estrutura de dados com Data Lake desenvolvido em plataforma AWS

2021

Com 47 anos de experiência no ensino de inglês e espanhol, o CNA é uma das maiores redes de ensino de idiomas do país, com mais de 600 escolas em todo o território nacional. Como parte de sua jornada de transformação digital, e para suportar sua cultura de decisão direcionada a dados, a companhia sentiu a necessidade de modernizar sua infraestrutura de dados e analytics evoluindo para uma arquitetura mais ágil e escalável, construída sobre um Data Lake utilizando a plataforma AWS.
Shot of two young women using a laptop together in a college library
kr_quotemark
A AWS forneceu as soluções de nuvem e tecnologias serverless que nos permitiram desenvolver um data lake robusto, flexível e com uma estrutura de custo competitiva”

Guilherme Pompeo
head de Data & Analytics do CNA

Desafio

Com quase 50 anos de atuação no ensino de inglês e espanhol no Brasil, a CNA é hoje uma das maiores redes de ensino de idiomas do País. Ao todo, são 635 escolas que atendem mais de 400 mil alunos, utilizando uma metodologia moderna que explora elementos presenciais e a distância, além de inovadores recursos tecnológicos, que inserem o idioma no cotidiano do aluno a fim de proporcionar fluência ao falar, ler, escrever e compreender a língua mais naturalmente.

Há alguns anos a instituição vem adotando uma cultura direcionada a dados. Para isso, criou uma estrutura on-premises, baseada em um data warehouse próprio. Com intensificação de sua jornada de transformação digital, e o crescimento da demanda dos stakeholders por mais digitalização, o CNA viu a necessidade de adotar uma arquitetura mais ágil, escalável e alinhada a estas novas demandas.

De acordo com o head de Data & Analyics da CNA, Guilherme Pompeo, o objetivo era criar uma estrutura que atendesse as complexidades da instituição de forma economicamente eficiente e escalável. “Precisávamos de mais velocidade na transformação das informações, na incorporação em dashboards e no consumo em análises, além de consolidar melhores práticas de transformação na camada de analytics”, explica.

O projeto também deveria possibilitar a integração com soluções de ML/IA, trazer mais flexibilidade para ingestão e transformação de informações de diversas fontes e formatos e mais confiabilidade do processo de ingestão de dados. Outros objetivos incluíam a centralização e visibilidade de todos os data assets, a potencialização das integrações e relacionamentos entre as informações e dar mais visibilidade e controle a cada etapa do processo de analytics, garantindo maior controle e gestão a todo o processo.

Para atender todos estes requisitos, o CNA decidiu pela criação de um Data Lake em nuvem e, para isso, iniciou a busca pelo provedor ideal.

Por que AWS

Do processo de seleção dos parceiros ideais para o projeto, foram definidos três: AWS, BRLink e Deal Technologies. “A AWS forneceu as soluções de nuvem e tecnologias serverless que nos permitiram desenvolver um data lake robusto, flexível e com uma estrutura de custo competitiva”, explica Pompeo, lembrando que a BR Link assumiu a construção dos ambientes na nuvem de forma segura e eficaz, criando toda a infraestrutura de conectividade entre os ambientes CNA e a mecânica de ingestão de dados.

O executivo lembra que a etapa final do processo ficou com a Deal Digital, que ajudou o CNA a construir um pipeline de transformação de dados alinhado aos conceitos e necessidades de negócio. Além das camadas de analytics, a Deal também deu suporte à modernização dos reportes de BI – em Power BI – alavancando os novos recursos de back-end analítico. 

Ao final do projeto, o CNA passou a contar com um Data Lake na nuvem utilizando tecnologias serverless e uma arquitetura preparada para ingerir dados estruturados e não estruturados. Essa arquitetura está capacitada para entregar uma camada de apresentação de dados consistente para os mais diversos propósitos, desde reportes de BI até insumos para modelos de Machine Learning, passando pela retroalimentação de sistemas transacionais e de negócios, com o CRM.

Para isso, o Data Lake é suportado por uma série de serviços AWS, tais como AWS Database Migration Services (AWS DMS), Amazon Simple Storage Service (Amazon S3), Amazon Athena, Amazon Redshift, AWS Lambda, Amazon Elastic Compute Cloud (Amazon EC2) e Amazon Simple Email Service (Amazon SES).

Benefícios

Já implementado, o Data Lake CNA conta hoje com todos os dados unificados e atualizados automaticamente, utilizando a tecnologia do Amazon Redshift Spectrum, juntamente com os dados armazenados no Amazon S3,  que é um ambiente com um custo de armazenamento otimizado. Esses dados são transformados dentro do cluster do Amazon Redshift, o que traz uma performance melhor e os disponibiliza para o desenvolvimento dos dashboards na plataforma de Business Intelligence (BI) do CNA.

“Hoje temos um pipeline de dados desenhado completamente para atender as necessidades da CNA de forma transparente e gerenciável, com flexibilidade e agilidade para respondermos as demandas futuras”, diz Pompeo.

Sobre a CNA

O CNA é uma das maiores redes de escolas de idiomas do país, operando no sistema de franquias através de 635 unidades e alcançando a mais de 400 mil alunos em todo o território nacional. Em 2020, o CNA é escolhido o Franqueador do Ano pela ABF (Associação Brasileira de Franchising), principal premiação do mercado de franquias brasileiro e também se tornou o único franqueador a obter o Selo de Excelência em Franchising por 29 vezes consecutivas.

Benefícios

  • 100% das bases da dados unificados, centralizadas e acessíveis via Redshift e/ou Redshift Spectrum;
  • 100% das atualização da base de dados realizada de forma automática;
  • 100% do reportes de BI integrados ao Data Lake;
  • 100% dos reportes demandados pelo negócio entregues através das informações viabilizadas pelo Data Lake;
  • Dashboards e relatórios disponibilizados com mais rapidez;
  • Maior flexibilidade a agilidade para responder demandas futuras.


Serviços AWS

AWS DMS

O AWS DMS ajuda você a migrar bancos de dados para a AWS de modo rápido e seguro. O banco de dados de origem permanece totalmente operacional durante a migração, minimizando o tempo de inatividade de aplicativos que dependem do banco de dados.

Saiba mais »

Amazon Athena

O Amazon Athena é um serviço de consultas interativas que facilita a análise de dados no Amazon S3 usando SQL padrão. O Athena não precisa de servidor. Portanto, não há infraestrutura para gerenciar e você paga apenas pelas consultas executadas.

Saiba mais »

Amazon Redshift

Com o Redshift, você pode consultar e combinar exabytes de dados estruturados e semiestruturados em data warehouses, bancos de dados operacionais e seu data lake usando o SQL padrão.

Saiba mais »

AWS Lambda

O AWS Lambda é um serviço de computação sem servidor que permite executar código sem provisionar ou gerenciar servidores, criando lógica de dimensionamento de cluster com reconhecimento de workloads, mantendo integrações de eventos ou gerenciando tempos de execução.

Saiba mais »


Comece agora

Empresas de todos os tamanhos e setores estão transformando seus negócios todos os dias usando a AWS. Entre em contato com nossos especialistas e comece hoje sua jornada na nuvem.