CNA moderniza estrutura de dados com Data Lake desenvolvido em plataforma AWS
2021
Guilherme Pompeo
head de Data & Analytics do CNA
Desafio
Há alguns anos a instituição vem adotando uma cultura direcionada a dados. Para isso, criou uma estrutura on-premises, baseada em um data warehouse próprio. Com intensificação de sua jornada de transformação digital, e o crescimento da demanda dos stakeholders por mais digitalização, o CNA viu a necessidade de adotar uma arquitetura mais ágil, escalável e alinhada a estas novas demandas.
De acordo com o head de Data & Analyics da CNA, Guilherme Pompeo, o objetivo era criar uma estrutura que atendesse as complexidades da instituição de forma economicamente eficiente e escalável. “Precisávamos de mais velocidade na transformação das informações, na incorporação em dashboards e no consumo em análises, além de consolidar melhores práticas de transformação na camada de analytics”, explica.
O projeto também deveria possibilitar a integração com soluções de ML/IA, trazer mais flexibilidade para ingestão e transformação de informações de diversas fontes e formatos e mais confiabilidade do processo de ingestão de dados. Outros objetivos incluíam a centralização e visibilidade de todos os data assets, a potencialização das integrações e relacionamentos entre as informações e dar mais visibilidade e controle a cada etapa do processo de analytics, garantindo maior controle e gestão a todo o processo.
Para atender todos estes requisitos, o CNA decidiu pela criação de um Data Lake em nuvem e, para isso, iniciou a busca pelo provedor ideal.
Por que AWS
O executivo lembra que a etapa final do processo ficou com a Deal Digital, que ajudou o CNA a construir um pipeline de transformação de dados alinhado aos conceitos e necessidades de negócio. Além das camadas de analytics, a Deal também deu suporte à modernização dos reportes de BI – em Power BI – alavancando os novos recursos de back-end analítico.
Ao final do projeto, o CNA passou a contar com um Data Lake na nuvem utilizando tecnologias serverless e uma arquitetura preparada para ingerir dados estruturados e não estruturados. Essa arquitetura está capacitada para entregar uma camada de apresentação de dados consistente para os mais diversos propósitos, desde reportes de BI até insumos para modelos de Machine Learning, passando pela retroalimentação de sistemas transacionais e de negócios, com o CRM.
Para isso, o Data Lake é suportado por uma série de serviços AWS, tais como AWS Database Migration Services (AWS DMS), Amazon Simple Storage Service (Amazon S3), Amazon Athena, Amazon Redshift, AWS Lambda, Amazon Elastic Compute Cloud (Amazon EC2) e Amazon Simple Email Service (Amazon SES).
Benefícios
“Hoje temos um pipeline de dados desenhado completamente para atender as necessidades da CNA de forma transparente e gerenciável, com flexibilidade e agilidade para respondermos as demandas futuras”, diz Pompeo.
Sobre a CNA
Benefícios
- 100% das bases da dados unificados, centralizadas e acessíveis via Redshift e/ou Redshift Spectrum;
- 100% das atualização da base de dados realizada de forma automática;
- 100% do reportes de BI integrados ao Data Lake;
- 100% dos reportes demandados pelo negócio entregues através das informações viabilizadas pelo Data Lake;
- Dashboards e relatórios disponibilizados com mais rapidez;
- Maior flexibilidade a agilidade para responder demandas futuras.
Serviços AWS
AWS DMS
O AWS DMS ajuda você a migrar bancos de dados para a AWS de modo rápido e seguro. O banco de dados de origem permanece totalmente operacional durante a migração, minimizando o tempo de inatividade de aplicativos que dependem do banco de dados.
Amazon Athena
O Amazon Athena é um serviço de consultas interativas que facilita a análise de dados no Amazon S3 usando SQL padrão. O Athena não precisa de servidor. Portanto, não há infraestrutura para gerenciar e você paga apenas pelas consultas executadas.
Amazon Redshift
Com o Redshift, você pode consultar e combinar exabytes de dados estruturados e semiestruturados em data warehouses, bancos de dados operacionais e seu data lake usando o SQL padrão.
AWS Lambda
O AWS Lambda é um serviço de computação sem servidor que permite executar código sem provisionar ou gerenciar servidores, criando lógica de dimensionamento de cluster com reconhecimento de workloads, mantendo integrações de eventos ou gerenciando tempos de execução.
Comece agora
Empresas de todos os tamanhos e setores estão transformando seus negócios todos os dias usando a AWS. Entre em contato com nossos especialistas e comece hoje sua jornada na nuvem.