Implementación de referencia

IBM Cloud Pak for Data en AWS

Una plataforma de IA y de datos con administración de datos, gobernanza y análisis

Esta solución de socios implementa IBM Cloud Pak for Data en un clúster de la plataforma de contenedor Red Hat OpenShift en la nube de Amazon Web Services (AWS). Cloud Pak for Data es una plataforma de análisis que ayuda a preparar datos para la inteligencia artificial (IA). Permite que los ingenieros de datos, los administradores de datos, los científicos de datos y los analistas de negocios trabajen juntos mediante el uso de una plataforma multinube integrada.

La implementación está destinada a usuarios empresariales que deseen conectar, catalogar, controlar, transformar y analizar datos, independientemente de su ubicación.

logotipo de IBM

IBM desarrolló esta solución de socios en colaboración con AWS. IBM es un socio de AWS.


Los administradores de AWS Service Catalog pueden agregar esta arquitectura a su propio catálogo.  

  •  Lo que creará
  • La solución de socios configura lo siguiente:

    • Una arquitectura de alta disponibilidad, que abarca una o tres Zonas de disponibilidad.*
    • Una VPC configurada con subredes públicas y privadas de acuerdo con las prácticas recomendadas de AWS para proporcionarle una red virtual propia en AWS.*
    • En las subredes públicas:
      • Una instancia de Amazon Elastic Compute Cloud (Amazon EC2) de nodo de arranque que también sirve como host bastión para permitir el acceso de entrada mediante Secure Shell (SSH) a las instancias EC2 en las subredes privadas.
      • Gateways administradas mediante traducción de direcciones de red (NAT) a fin de permitir el acceso de salida a Internet a recursos de las subredes privadas.*
    • En las subredes privadas:
      • Nodos maestros de la plataforma de contenedores OpenShift (OCP) en hasta tres zonas de disponibilidad.
      • Nodos de cómputo de OCP que combinan servicios por Cloud Pak for Data (recopilar, organizar y analizar).
      • Para los datos persistentes de los contenedores, se montan discos de Elastic Block Store en los nodos de cómputo.
    • Un balanceador de carga maestro, que se extiende a las subredes privadas, para acceder los nodos de cómputo de OCP. Este recurso provee acceso mediante navegador web a Cloud Pak for Data.
    • Un balanceador de carga de aplicaciones, que se extiende a las subredes privadas, para acceder a los nodos de cómputo de OCP.
    • Auto Scaling de OpenShift para los nodos de cómputo de OCP.
    • Amazon Route 53, como su sistema de nombres de dominio (DNS), para resolver los nombres de dominio de la consola de administración de IBM Cloud Pak for Data.
    • Amazon S3 para almacenar los registros de implementación y los secretos de extracción.

    * En la plantilla con la que se implementa la solución de socios en una VPC existente, se omiten los componentes marcados con asteriscos y se le pide la configuración de su VPC existente.

  •  Cómo implementar
  • Para implementar IBM Cloud Pak for Data, siga las instrucciones de la guía de implementación. Una implementación estándar tarda unas 3 horas y una implementación de alta disponibilidad (HA) tarda unas 4 horas. El proceso de implementación incluye los siguientes pasos:

    1. Esta solución de socios requiere una suscripción a Red Hat. Durante la implementación, proporcione su secreto de extracción de infraestructura aprovisionado por el instalador de OpenShift. Para adquirir una licencia de evaluación de 60 días para OpenShift, siga las instrucciones en Evaluate Red Hat OpenShift Container Platform (Evaluación de Red Hat OpenShift Container Platform).
    2. Suscríbase a Cloud Pak for Data. Si no tiene un permiso pago, puede crear una clave de suscripción de prueba para 60 días.
    3. Elija una opción de almacenamiento en contenedor.
    4. Si aún no tiene una cuenta de AWS, regístrese en https://aws.amazon.com e inicie sesión.
    5. Elija una de las siguientes opciones para lanzar la solución del socio. Asegúrese de elegir su región en la barra de herramientas antes de crear la pila.
    6. (Opcional) Edite el grupo de seguridad de la aplicación.
    7. Utilice el cliente web de Cloud Pak for Data para probar la implementación.
    8. Administre su clúster con la consola de OpenShift.
    9. (Opcional) Proporcione acceso SSH al nodo de arranque.

    Amazon puede compartir la información de implementación de los usuarios con el socio de AWS que colaboró con AWS en esta solución.  

  •  Costos y licencias
  • Puede empezar con una prueba de 60 días o usar su permiso de Cloud Pak for Data existente. Los costos adicionales dependerán del tipo de almacenamiento de su plataforma. Puede elegir tres clases de almacenamiento: Amazon EFS, Portworx u OCS. Los costos de EFS se agregan automáticamente a su cuenta de AWS. Tiene la opción de usar una versión de prueba de Portworx o una versión de evaluación de OCS. Para obtener más información, consulte Portworx o OCS.

    Para consultar los precios de Cloud Pak for Data o para usar sus permisos existentes, póngase en contacto con su representante de ventas de IBM al +1 (877) 426-3774. Si desea obtener más información sobre los términos de la concesión de licencias, consulte el acuerdo de licencia de IBM.

    Usted es responsable del costo de los servicios de AWS, así como de las licencias de terceros que se utilicen, mientras se ejecuta esta solución. No se aplican cargos adicionales por el uso de la solución.

    En esta solución, se incluyen parámetros de configuración que puede personalizar. Algunas de estas configuraciones, como el tipo de instancia, afectan al costo del despliegue. Para hacer estimaciones de costos, consulte las páginas de precios de cada servicio de AWS que utilice. Los precios están sujetos a cambios.

    Sugerencia: Después de implementar una solución, cree Informes de costo y uso de AWS para realizar el seguimiento de los costos asociados. Dichos informes envían métricas de facturación a un bucket de Amazon Simple Storage Service (Amazon S3) en su cuenta. Suministran estimaciones de costos en función del uso de cada mes y agregan los datos a finales del mes. Para obtener más información, consulte ¿Qué son los informes de costo y uso de AWS?