implantação de referência

Data lake com SnapLogic na AWS

Criação, definição e configuração automatizadas de hardware e software para criação de um data lake

Este Quick Start cria um ambiente de data lake na nuvem da Amazon Web Services (AWS) em cerca de 15 minutos implantando componentes do SnapLogic e serviços da AWS, como Amazon Simple Storage Service (Amazon S3) e Amazon Redshift. Você pode criar uma nova infraestrutura de Virtual Private Cloud (VPC) configurada para segurança, escalabilidade e alta disponibilidade ou usar sua infraestrutura de VPC existente para o data lake.

SnapLogic é uma plataforma de integração de dados que pode se conectar a qualquer fonte e fornecer dados em um formato adequado para soluções analíticas. O servidor SnapLogic Groundplex é o componente subjacente que processa dados de várias fontes. Os servidores Groundplex são implantados automaticamente na AWS para permitir que você processe os dados necessários para criar soluções analíticas.

Este Quick Start destina-se a usuários que desejam acelerar iniciativas de big data. Ele inclui padrões básicos de integração com o Amazon S3 e o Amazon Redshift usando os conectores de integração do SnapLogic e as práticas recomendadas da Agilisium Consulting.

logotipo da micro focus
logotipo da micro focus

Este Quick Start foi desenvolvido pela Agilisium Consulting em colaboração com a AWS. A Agilisium Consulting é uma parceira da APN.

  •  O que você criará
  • Use este Quick Start para configurar o seguinte ambiente na AWS:

    • Uma arquitetura de alta disponibilidade que abrange duas zonas de disponibilidade.*
    • Uma VPC configurada com sub-redes públicas e privadas de acordo com as melhores práticas da AWS para provisionar sua própria rede virtual na AWS.*
    • Nas sub-redes públicas:
      • Gateways gerenciados de conversão de endereço de rede (NAT) para permitir o acesso de saída à Internet para recursos em sub-redes privadas.*
      • Um bastion host do Linux em um grupo de Auto Scaling para permitir acesso de entrada do SSH (Secure Shell) às instâncias do Amazon Elastic Compute Cloud (Amazon EC2) em sub-redes públicas e privadas.*
    • Nas sub-redes privadas, servidores SnapLogic Groundplex em um grupo de Auto Scaling para executar as pipelines do SnapLogic.
    • Em uma das sub-redes privadas, um cluster do Redshift para armazenar dados agregados para consumo e análise.

    * O modelo que implanta o Quick Start em uma VPC existente ignora os componentes marcados com asteriscos e solicita sua configuração desta VPC existente.

  •  Como implantar
  • Para implantar um data lake com o SnapLogic na AWS, siga as instruções no guia de implantação. O processo de implantação inclui as seguintes etapas:

    1. Caso ainda não tenha uma conta na AWS, cadastre-se em https://aws.amazon.com e acesse sua conta.
    2. Obtenha uma licença de teste do SnapLogic e um arquivo de configuração do Groundplex. Você pode se inscrever para um teste gratuito de 30 dias.
    3. Faça o download do arquivo de configuração do Groundplex.
    4. Faça o upload do arquivo de configuração do Groundplex para um bucket privado do S3.
    5. Inicie o Quick Start. Cada implantação demora cerca de 15 minutos. Você pode escolher entre duas opções:
    6. Teste a implantação validando o status de servidor do Groundplex.

    A Amazon pode compartilhar informações sobre implantações de usuários com o parceiro da AWS que colaborou com a AWS nesta solução de parceiro.  

  •  Custo e licenças
  • Você é responsável pelo custo dos produtos da AWS usados durante a implantação de referência do Quick Start.

    Não existem custos adicionais de licença envolvidos para usar o Quick Start.

    O modelo da AWS CloudFormation para este Quick Start inclui parâmetros de configuração personalizáveis. Alguns desses parâmetros, como o tipo de instância, afetarão o custo da implantação. Para obter estimativas de custo, leia as páginas de definição de preço de cada produto da AWS que você usará. Esses preços estão sujeitos a mudanças.

    Dica     Depois de implantar o Quick Start, recomendamos que você habilite os Relatórios de custos e uso da AWS para monitorar os custos associados com o Quick Start. Esses relatórios fornecem métricas de faturamento para um bucket do Amazon S3 na sua conta. Ele fornece estimativas de custo com base no uso ao longo de cada mês e finaliza os dados no fim do mês. Confira mais informações sobre os relatórios na documentação da AWS.

    Você precisa fornecer sua própria licença do SnapLogic e o arquivo de configuração do Groundplex. Se você ainda não os tiver, poderá solicitar uma licença de teste gratuita de 30 dias preenchendo o formulário de inscrição no site da SnapLogic. Você receberá um ID de usuário e uma senha exclusivos da SnapLogic com um arquivo de configuração do Groundplex para usar durante o processo de implantação do Quick Start.