implementación de referencia

Modular architecture for Amazon Redshift

Implemente un almacenamiento de datos de Amazon Redshift en la nube de AWS para big data y análisis.

Este Quick Start permite implementar automáticamente un entorno modular de alta disponibilidad para Amazon Redshift en la nube de Amazon Web Services (AWS).

Amazon Redshift es un almacenamiento de datos rápido y completamente administrado que permite analizar todos los datos mediante el uso del lenguaje de consulta estructurada (SQL) estándar y las herramientas de inteligencia de negocios existentes de forma sencilla y rentable. Permite ejecutar consultas analíticas complejas en petabytes de datos estructurados con una sofisticada optimización de consultas, columnar storage en discos locales de alto rendimiento y ejecución masiva de consultas paralelas.   

La administración de almacenes de datos tradicionales requiere bastante tiempo y recursos, en particular cuando se trata de grandes conjuntos de datos. Además, el costo económico asociado con la compilación, el mantenimiento y el crecimiento de almacenes de datos locales y administrados automáticamente también es muy alto. Amazon Redshift no solo reduce de manera significativa el costo y la carga operativa de un almacenamiento de datos sino que, con Redshift Spectrum, también se facilita el análisis de grandes volúmenes de datos en su formato nativo sin la necesidad de cargarlos.

Logotipo de Portworx

Este Quick Start fue desarrollado por AWS.


Los administradores de AWS Service Catalog pueden agregar esta arquitectura a su propio catálogo.  

  •  Lo que creará
  • Utilice este Quick Start para configurar de manera automática el siguiente entorno de Amazon Redshift en AWS:

    • Una arquitectura de nube virtual privada (VPC) con alta disponibilidad que abarca dos zonas de disponibilidad. La VPC está configurada con subredes públicas y privadas de acuerdo con las prácticas recomendadas de AWS para proporcionarle su propia red virtual en AWS.*
    • En las subredes públicas:
      • Gateways administradas mediante traducción de direcciones de red (NAT) para permitir el acceso saliente a Internet a recursos de las subredes privadas.*
      • Un host bastión de Linux en un grupo de Auto Scaling para permitir el acceso de entrada mediante Secure Shell (SSH) a las instancias de Amazon Elastic Compute Cloud (Amazon EC2) en las subredes públicas y privadas.*
    • En una subred privada, un clúster de Amazon Redshift y sus componentes, como un grupo de subredes de clúster, un grupo de parámetros, administración de las cargas de trabajo (WLM) y un grupo de seguridad que permite el acceso a la VPC. Este es el comportamiento predeterminado. No obstante, también se pueden crear el clúster y sus componentes en las subredes públicas, de forma que sean de acceso público.
    • Un bucket de Amazon Simple Storage Service (Amazon S3) para los registros de auditoría.
    • Un punto de enlace de la VPC para Amazon S3, de manera que Amazon Redshift y otros recursos de AWS que se ejecutan en una subred privada puedan tener acceso controlado a los buckets de Amazon S3.
    • El Quick Start utiliza una clave de AWS Key Management Service (AWS KMS) para permitir el cifrado en reposo del clúster de Amazon Redshift, y utiliza una clave principal predeterminada cuando no se define otra clave. 
    • Alarmas de Amazon CloudWatch para monitorizar la CPU en el host bastión, para monitorizar la CPU y el espacio de disco del clúster de Amazon Redshift y para enviar una notificación de Amazon SNS cuando se activa la alarma.
    • Un rol de AWS Identity and Access Management (IAM) que otorgue los permisos mínimos necesarios para usar Redshift Spectrum con Amazon S3, Amazon CloudWatch Logs, AWS Glue y Amazon Athena.
    • Un catálogo de AWS Glue como almacén de metadatos.

    *  En la plantilla con la que se implementa el Quick Start en una VPC existente, se omiten las tareas marcadas con asteriscos y se le pide la configuración de su VPC existente.

  •  Cómo realizar la implementación
  • Para implementar el entorno de Amazon Redshift en su cuenta de AWS, siga las instrucciones de la guía de implementación. El proceso de implementación dura entre 10 y 15 minutos e incluye estos pasos:

    1. Si aún no tiene una cuenta de AWS, regístrese en https://aws.amazon.com e inicie sesión en su cuenta.
    2. Elija una de las siguientes opciones para lanzar el Quick Start:
    3. Pruebe la implementación y confirme que el clúster de Amazon Redshift y el host bastión de Linux aceptan las conexiones.
     
    Para personalizar su implementación, puede configurar la VPC, el host bastión y la base de datos; si lo desea, también puede establecer etiquetas de base de datos.

    Amazon puede compartir la información de implementación de los usuarios con el socio de AWS que colaboró con AWS en esta solución.  

  •  Costo y licencias
  • Usted es responsable del costo de los servicios de AWS implementados por este Quick Start No hay costos adicionales por el uso del Quick Start.

    En las plantillas de AWS CloudFormation para este Quick Start, se incluyen parámetros de configuración que se pueden personalizar. Con algunas de estas configuraciones, como el tipo de instancia de base de datos, se verá afectado el costo de implementación. Para obtener estimaciones de costos, consulte las páginas de precios de cada servicio de AWS que utilizará. Los precios pueden modificarse.

    Sugerencia: después de implementar Quick Start, recomendamos activar el AWS Cost and Usage Report para realizar un seguimiento de los costos asociados con Quick Start. Este informe envía métricas de facturación a un bucket de Amazon Simple Storage Service (Amazon S3) de su cuenta. Se suministran estimaciones de costos en función del uso de cada mes, y se finalizan los datos a finales del mes. Para obtener más información sobre el informe, consulte la documentación de AWS.