déploiement de référence

Architecture modulaire pour Amazon Redshift

Déployer un entrepôt de données Amazon Redshift sur le Cloud AWS pour le Big Data et les analyses

Ce Quick Start déploie automatiquement un environnement modulaire à haute disponibilité Amazon Redshift sur le Cloud Amazon Web Services (AWS).

Amazon Redshift est un service d'entrepôt de données rapide et entièrement géré. Il permet d'analyser de manière simple et économique toutes vos données grâce à vos outils d'informatique décisionnelle existants et à une syntaxe SQL (structured query language) standard. Vous pouvez ainsi exécuter des requêtes analytiques complexes sur plusieurs pétaoctets de données structurées en utilisant l'optimisation de requêtes sophistiquée, le stockage en colonnes sur des disques locaux hautes performances et l'exécution de requêtes massivement parallèle.   

La gestion des entrepôts de données classiques nécessite beaucoup de temps et de ressources, en particulier pour les ensembles de données volumineux. En outre, le coût financier associé à la conception, à la maintenance et au développement d'un entrepôt de données autogéré sur site est très élevé. Non seulement Amazon Redshift permet de réduire significativement les coûts et la charge opérationnelle liés à un entrepôt de données, mais avec Redshift Spectrum, ce service facilite également l'analyse des gros volumes de données dans leur format natif, sans que vous ayez besoin de charger ces données.

Logo portworx

Ce Quick Start a été développé par AWS.


Les administrateurs AWS Service Catalog peuvent ajouter cette architecture à leur propre catalogue.  

  •  Votre projet de création
  • Utilisez ce déploiement Quick Start pour configurer automatiquement l'environnement Amazon Redshift suivant sur AWS :

    • Une architecture Virtual Private Cloud (VPC) hautement disponible qui couvre deux zones de disponibilité. Le VPC est configuré avec des sous-réseaux publics et privés, conformément aux meilleures pratiques AWS, afin de vous fournir votre propre réseau virtuel sur AWS.*
    • Dans les sous-réseaux publics :
      • Des passerelles NAT (Network Address Translation) gérées pour autoriser l'accès Internet sortant pour les ressources des sous-réseaux privés.*
      • Un hôte bastion Linux dans un groupe Auto Scaling pour permettre un accès Secure Shell (SSH) entrant aux instances Amazon Elastic Compute Cloud (Amazon EC2) dans les sous-réseaux privés et publics.*
    • Dans un sous-réseau privé, un cluster Amazon Redshift et ses composants, tels qu'un groupe de sous-réseaux de cluster, un groupe de paramètres, la gestion des charges de travail (WLM) et un groupe de sécurité qui autorise l'accès au VPC. Il s'agit du comportement par défaut. Cependant, vous pouvez également choisir de créer le cluster et ses composants dans les sous-réseaux publics, de manière à ce qu'ils soient accessibles au public.
    • Un compartiment Amazon Simple Storage Service (Amazon S3) pour les journaux d'audit.
    • Un point de terminaison VPC pour Amazon S3, de sorte qu'Amazon Redshift et les autres ressources AWS exécutées dans un sous-réseau privé puissent disposer d'un accès contrôlé aux compartiments Amazon S3.
    • Le Quick Start utilise une clé du AWS Key Management Service(AWS KMS) pour activer le chiffrement inactif pour le cluster Amazon Redshift, et crée une clé principale par défaut lorsqu'aucune autre clé n'est définie. 
    • Amazon CloudWatch émet des alarmes pour surveiller le processeur sur l'hôte bastion, pour contrôler le processeur et l'espace disque du cluster Amazon Redshift et pour envoyer une notification Amazon SNS, lorsque l'alarme est déclenchée.
    • Un rôle AWS Identity and Access Management (IAM) qui accorde les autorisations minimales requises pour utiliser Redshift Spectrum avec Amazon S3, Amazon CloudWatch Logs, AWS Glue et Amazon Athena.
    • Un catalogue AWS Glue en tant que magasin de métadonnées.

    * Le modèle qui déploie le Quick Start dans un VPC existant ignore les composants marqués d'un astérisque et vous demande d'indiquer la configuration de votre VPC existant.

  •  Procédure de déploiement
  • Pour déployer l'environnement Amazon Redshift dans votre compte AWS, suivez les instructions du guide de déploiement. Le processus de déploiement dure 10 à 15 minutes et comprend les étapes suivantes :

    1. Si vous n'avez pas encore de compte AWS, inscrivez-vous sur https://aws.amazon.com et connectez-vous à votre compte.
    2. Lancez le Quick Start en choisissant l'une des options suivantes :
    3. Testez le déploiement et vérifiez que le cluster Amazon Redshift et l'hôte bastion Linux acceptent les connexions.
     
    Pour personnaliser votre déploiement, vous pouvez configurer vos paramètres de VPC, d'hôte bastion et de base de données et, si vous le souhaitez, définir des balises de base de données.

    Amazon peut être amené à partager les informations relatives au déploiement des utilisateurs avec le partenaire AWS qui a élaboré cette solution en collaboration avec AWS.  

  •  Coût et licences
  • Vous devez assumer les coûts liés aux services AWS utilisés pendant l'exécution du déploiement de référence de ce Quick Start. L'utilisation du Quick Start n'entraîne aucun coût supplémentaire.

    Les modèles AWS CloudFormation pour ce Quick Start incluent des paramètres de configuration que vous pouvez personnaliser. Certains de ces paramètres, comme le type d'instance de base de données, affecteront le coût du déploiement. Pour obtenir des estimations des coûts, consultez la page de tarification de chaque service AWS que vous comptez utiliser. Les prix sont susceptibles de changer.

    Conseil : après avoir déployé le Quick Start, nous vous recommandons d'activer le rapport de coût et d'utilisation AWS afin de suivre les coûts associés au Quick Start. Ce rapport fournit des métriques de facturation à un compartiment Amazon Simple Storage Service (Amazon S3) de votre compte. Il fournit des estimations de coûts basées sur l'utilisation mensuelle du débit et finalise les données à la fin du mois. Pour en savoir plus sur le rapport, référez-vous à la documentation d'AWS.