Quick Starts de AWS — Soluciones para clientes listas para usar

Informatica Data Lake Management on AWS

Cree un entorno de lago de datos con tecnología de Informatica y servicios de AWS

El Quick Start permite crear un entorno de lago de datos en la nube de Amazon Web Services (AWS) mediante la implementación de la solución Informatica Data Lake Management y servicios de AWS, como Amazon EMR, Amazon Redshift, Amazon Simple Storage Service (Amazon S3) y Amazon Relational Database Service (Amazon RDS).

Un lago de datos utiliza un único repositorio de datos basado en Hadoop que lo ayuda a administrar el suministro y la demanda de datos. La solución de Informatica en AWS integra, organiza, administra, controla y protege grandes volúmenes de datos estructurados y no estructurados. La solución provee información segura, fiable, procesable y personalizada para lograr una perspectiva empresarial.

Mediante el Quick Start se configura la infraestructura de AWS, se implementan los componentes de Informatica Data Lake Management y se integran automáticamente clústeres de Hadoop en una nube virtual privada (VPC) para tareas de procesamiento y almacenamiento de metadatos. Se asigna la conexión al clúster de Amazon EMR para el sistema de archivos distribuido de Hadoop (HDFS) y Hive. También se configuran las conexiones para activar el análisis de entornos de Amazon S3 y Amazon Redshift como parte del lago de datos.

datalake_icon_crs_informatica

Informatica desarrolló este Quick Start en colaboración con AWS. Informatica es un
socio de APN.

  •  Lo que creará
  •  Cómo realizar la implementación
  •  Costo y licencias
  •  Recursos
  •  Lo que creará
  • Si decide implementar el Quick Start en una VPC nueva, se configurará la siguiente infraestructura de AWS para el lago de datos:

    • Una VPC configurada con subredes públicas y privadas que abarca dos zonas de disponibilidad.
    • Una gateway de Internet para permitir el acceso a Internet.
    • En las subredes públicas, gateways administradas mediante traducción de dirección de red (NAT) configuradas con una dirección IP elástica para la conectividad a Internet de salida.

    Con el Quick Start también se instalan y configuran los siguientes componentes de Informatica:

    • Dominio de Informatica, que es la unidad administrativa fundamental de la plataforma de Informatica.
    • Model Repository Service, que es una base de datos relacional que almacena todos los metadatos de los proyectos que se crearon con las herramientas cliente de Informatica. Las bases de datos Model Repository Service y el dominio de Informatica se alojan en Amazon RDS mediante el uso de Oracle, que se ocupa de las tareas de administración, como copias de respaldo, administración de parches y replicación.
    • Data Integration Service, que administra las solicitudes para enviar trabajos de integración con big data, calidad de big data y creación de perfiles al clúster de Hadoop para su procesamiento.
    • Content Management Service, que administra datos de referencia. Suministra información de datos de referencia a Data Integration Service e Informatica Developer.
    • Analyst Service, que ejecuta la herramienta Analyst en el dominio de Informatica. Analyst Service administra las conexiones entre los componentes del servicio y los usuarios que inician sesión en la herramienta Analyst.
    • Profiling, que ayuda a encontrar el contenido, la calidad y la estructura de los orígenes de datos de una aplicación, un esquema o una empresa.
    • Business Glossary, que consiste en glosarios online de términos empresariales y políticas que definen conceptos importantes dentro de una organización.
    • Catalog Service, que ejecuta Enterprise Data Catalog y administra conexiones entre componentes de servicios y aplicaciones externas.
    • Un clúster de Hadoop integrado que usa Hortonworks con HDFS, Hbase, Yarn y Solr.
    • Informatica Cluster Service, que ejecuta y administra todos los servicios de Hadoop, el servidor Apache Ambari y los agentes de Apache Ambari en el clúster integrado de Hadoop.
    • Metadata y Catalog, que incluyen el almacén de persistencia de datos, el índice de búsqueda y una base de datos de gráficos en un clúster de Hadoop integrado.
  •  Cómo realizar la implementación
  • Puede crear su entorno de lago de datos en AWS con los siguientes pasos:

    1. Si aún no tiene una cuenta de AWS, regístrese en https://aws.amazon.com.
    2. Cargue su licencia de Informatica a un bucket de S3. Si desea registrarse para recibir una licencia de demostración, entre en contacto con Informatica.
    3. Inicie el Quick Start. Cada implementación demora alrededor de dos horas. Puede elegir entre dos opciones:
    4. Controle la creación del dominio de Informatica y de la instancia en clúster.
    5. Use los enlaces de salida de Quick Start si desea descargar e instalar Informatica Developer para las tareas de integración de datos.

    El Quick Start incluye parámetros que puede personalizar. Por ejemplo, puede configurar la red o personalizar los ajustes de Amazon EMR, Amazon Redshift, Amazon RDS y del software de Informatica.

  •  Costo y licencias
  • Deberá pagar el costo de los servicios de AWS que se utilicen para ejecutar esta implementación de referencia del Quick Start. No hay costos adicionales por el uso del Quick Start.

    En las plantillas de AWS CloudFormation para este Quick Start, se incluyen parámetros de configuración que puede personalizar. Algunas de estas configuraciones, como el tipo de instancia, influyen en el costo de la implementación. Consulte las páginas de precios de cada servicio de AWS que utilizará para obtener estimaciones de costos.

    Es necesario contar con una licencia para la solución Informatica Data Lake Management a los fines de poder implementarla con este Quick Start. Si desea registrarse para recibir una licencia de demostración, entre en contacto con Informatica.

  •  Recursos
  • Esta implementación de referencia del Quick Start está vinculada con la solución presentada en Solution Space, que incluye un resumen de la solución, productos de consultoría opcionales desarrollados por socios con competencias de AWS y la inversión conjunta de AWS en proyectos de prueba de concepto. Para obtener más información sobre estos recursos, visite Solution Space. Tampoco se pierda las ofertas iniciales de NGDATA, Hitachi y Cognizant.