Publicado en: Nov 7, 2017
Este Quick Start automatiza el diseño, instalación y configuración de hardware y software para implementar un lago de datos en la nube de Amazon Web Services (AWS). El Quick Start proporciona componentes de la plataforma de big data Talend y servicios de AWS como Amazon EMR, Amazon Redshift, Amazon Simple Storage Service (Amazon S3) y Amazon Relational Database Service (Amazon RDS) para crear un lago de datos. También ofrece un juego de datos de muestra opcional y trabajos de Talend desarrollados por Cognizant Technology Solutions destinados a ilustrar las prácticas de big data en la integración de las tecnologías de Apache Spark, Apache Hadoop, Amazon EMR, Amazon Redshift y Amazon S3 en una implementación de lago de datos.
Este Quick Start está dirigido a los usuarios que evalúan big data en la nube o que desean acelerar sus iniciativas de big data adoptando prácticas recomendadas para la integración de big data. El Quick Start tiene las características siguientes:
- Permite el autoservicio, ofreciendo los servicios y componentes requeridos para crear un lago de datos.
- Ofrece flexibilidad para activar entornos de desarrollo, pruebas y producción.
- Incluye un conjunto de datos de muestra opcional y trabajos de Talend Spark preparados como ayuda para explorar la arquitectura y comprender las etapas del flujo de datos de extremo a extremo.
- Incluye funciones de adquisición, procesamiento y almacenamiento de datos con las posibilidades de Talend y Spark.
- Ofrece de forma opcional el marco de adquisición Cognizant, validación de big data y la plataforma DevOps para la adquisición, validación e implementación de soluciones de big data. (Estas características no se automatizan con la plantilla CloudFormation del Quick Start).
Las plantillas de AWS CloudFormation que automatizan la implementación pueden personalizarse.
Para empezar, use los recursos siguientes:
- Más información sobre la arquitectura de lago de datos
- Consulte la guía de implementación.
- Navegue y lance otras implementaciones de referencia de AWS Quick Start.
Acerca de los inicios rápidos
Los inicios rápidos son implementaciones de referencia automatizadas para cargas de trabajo clave en la nube de AWS. Cada inicio rápido lanza, configura y ejecuta los servicios de computación, red y almacenamiento de AWS y otros servicios necesarios para implementar una carga de trabajo específica en AWS usando las prácticas de seguridad de AWS en materia de seguridad y disponibilidad. Se trata de la última de un conjunto de soluciones AWS preparadas para el cliente que ofrecen arquitecturas de referencia listas para su implementación y prácticas recomendadas para afrontar casos de uso o procesos de negocio específicos. Este Quick Start ha sido elaborado por Talend y Cognizant en colaboración con AWS.