implantação de referência

Arquitetura modular para o Amazon Redshift

Implantar um armazém de dados do Amazon Redshift na Nuvem AWS para implementar big data e análise

Este Quick Start implanta automaticamente um ambiente modular altamente disponível para o Amazon Redshift na nuvem da Amazon Web Services (AWS).

O Amazon Redshift é um armazém de dados rápido e gerenciado que permite analisar todos os dados com simplicidade e economia usando ferramentas de linguagem de consultas estruturadas (SQL) padrão e ferramentas de inteligência de negócios existentes. O serviço permite executar consultas complexas de análise em petabytes de dados estruturados, usando otimização de consultas sofisticada, armazenamento colunar em discos locais de alta performance e execução paralela massiva de consultas.   

A administração de armazéns de dados tradicionais exige tempo e recursos substanciais, particularmente para grandes conjuntos de dados. Além disso, o custo financeiro associado às atividades de criação, manutenção e crescimento de armazéns de dados locais autogerenciáveis é muito alto. O Amazon Redshift não apenas reduz significativamente o custo e a sobrecarga operacional de um armazém de dados, como também torna fácil, usando o Redshift Spectrum, analisar grandes quantidade de dados em seus formatos nativos sem a necessidade carregá-los.

logotipo da portworx

Esse Quick Start foi desenvolvido pela AWS.


Administradores do AWS Service Catalog podem adicionar esta arquitetura a seus próprios catálogos.  

  •  O que você criará
  • Use este Quick Start para configurar automaticamente o seguinte ambiente do Amazon Redshift na AWS:

    • Uma arquitetura altamente disponível da Virtual Private Cloud (VPC) que abrange duas Zonas de disponibilidade. A VPC é configurada com sub-redes públicas e privadas de acordo com as melhores práticas da AWS, para fornecer sua própria rede virtual na AWS.*
    • Nas sub-redes públicas:
      • Gateways gerenciados de conversão de endereço de rede (NAT) para permitir o acesso de saída à Internet para recursos em sub-redes privadas.*
      • Um bastion host do Linux em um grupo de Auto Scaling para permitir acesso de entrada do SSH (Secure Shell) às instâncias do Amazon Elastic Compute Cloud (Amazon EC2) em sub-redes públicas e privadas.*
    • Em uma sub-rede pública, um cluster do Amazon Redshift e seus componentes, como grupo de sub-redes do cluster, grupo de parâmetros, gerenciamento de cargas de trabalho (WLM) e grupo de segurança, que viabilizam o acesso à VPC. Este é o comportamento padrão. Contudo, você também pode optar por criar o cluster e seus componentes em sub-redes públicas, de forma que se tornem publicamente acessíveis.
    • Um bucket do Amazon Simple Storage Service (Amazon S3) para logs de auditoria.
    • Um VPC endpoint para o Amazon S3, de forma que o Amazon Redshift e outros recursos da AWS executados em uma sub-rede privada possam oferecer acesso controlado para buckets do Amazon S3.
    • O Quick Start utiliza uma chave do AWS Key Management Service (AWS KMS) para habilitar criptografia de dados ociosos para o cluster do Amazon Redshift e cria uma chave mestra padrão quando nenhuma outra chave for configurada. 
    • Alarmes do Amazon CloudWatch para monitorar a CPU no bastion host, monitorar a CPU e o espaço em disco do cluster do Amazon Redshift e enviar uma notificação do Amazon SNS quando esse alarme for acionado.
    • Uma função do AWS Identity and Access Management (IAM) que garanta as permissões mínimas exigidas para usar o Redshift Spectrum com o Amazon S3, o Amazon CloudWatch Logs, o AWS Glue e o Amazon Athena.
    • Um catálogo do AWS Glue como uma loja de metadados.

    * O modelo que implanta o Quick Start em uma VPC existente ignora os componentes marcados com asteriscos e solicita a configuração dessa VPC existente.

  •  Como implantar
  • Para implantar o ambiente do Amazon Redshift na sua conta da AWS, siga as instruções no guia de implantação. O processo de implantação demora de 10 a 15 minutos e inclui as seguintes etapas:

    1. Caso ainda não tenha uma conta da AWS, cadastre-se em https://aws.amazon.com e acesse sua conta.
    2. Execute o Quick Start, escolhendo entre as seguintes opções:
    3. Teste a implantação e confirme se o cluster do Amazon Redshift e o bastion host do Linux estão aceitando conexões.
     
    Para personalizar sua implantação, você pode configurar suas definições de VPC, bastion host e banco de dados e, opcionalmente, definir tags de banco de dados.

    A Amazon pode compartilhar informações sobre implantações de usuários com o parceiro da AWS que colaborou com a AWS nesta solução.  

  •  Custo e licenças
  • Você é responsável pelo custo dos serviços da AWS usados durante essa implantação de referência do Quick Start. Não há custo adicional para usar o Quick Start.

    Os modelos do AWS CloudFormation para este Quick Start incluem parâmetros de configuração personalizáveis. Algumas dessas configurações, como o tipo de instância de banco de dados, afetarão o custo da implantação. Para obter estimativas de custos, leia as páginas de definição de preço de cada serviço da AWS que você usará. Esses preços estão sujeitos a mudanças.

    Dica: depois de implantar o Quick Start, recomendamos que você habilite o AWS Cost and Usage Reports para monitorar os custos associados ao Quick Start. Este relatório fornece métricas de faturamento para um bucket do Amazon Simple Storage Service (Amazon S3) em sua conta. Ele fornece estimativas de custo com base no uso ao longo de cada mês e finaliza os dados no fim do mês. Para obter mais informações sobre o relatório, consulte a documentação da AWS.