Implementación de referencia

Ciencia de datos predictiva con Amazon SageMaker y un algo de datos en AWS

Almacene y transforme datos para crear aplicaciones predictivas y prescriptivas

El Quick Start crea un entorno de lago de datos para crear, entrenar e implementar modelos de aprendizaje automático (ML) con Amazon SageMaker en la nube de Amazon Web Services (AWS). La implementación lleva aproximadamente de 10 a 15 minutos y utiliza servicios de AWS como Amazon Simple Storage Service (Amazon S3), Amazon API Gateway, AWS Lambda, Amazon Kinesis Data Streams y Amazon Kinesis Data Firehose.

Amazon SageMaker es una plataforma administrada que permite a los desarrolladores y científicos de datos crear, entrenar e implementar modelos de ML de manera rápida y sencilla.

Quick Start es para aquellos usuarios que quieren dar rienda suelta a la potencia de sus datos para realizar modelos predictivos y prescriptivos para agregar valor empresarial, sin necesidad de configurar clústeres de hardware de ML complejos. Permite realizar tareas vinculadas con la ciencia de datos de extremo a extremo, a partir de los datos sin procesar y terminando con una API REST de predicción en un sistema de producción.

Quick Start proporciona también un escenario de demostración desarrollado para Pariveda Solutions. En la demostración se ve cómo almacenar datos sin procesar en Amazon S3, cómo transformarlos para utilizarlos en Amazon SageMaker, cómo usar Amazon SageMaker para crear un modelo de ML y cómo alojar el modelo en una API de predicción para obtener precios de Spot para Amazon Elastic Compute Cloud (Amazon EC2).

pariveda-data-lake-sagemaker-LP-logo

Pariveda Solutions, Inc. desarrolló este Quick Start en colaboración con AWS. Pariveda es un socio de APN.

  •  Lo que creará
  •  Cómo realizar la implementación
  •  Costo y licencias
  •  Recursos
  •  Lo que creará
  • La arquitectura del Quick Start incluye los siguientes elementos:

    • Un lago de datos estructurados en Amazon S3 para alojar datos sin procesar, modelados, mejorados y transformados.
    • Un bucket de almacenamiento temporal para la datos de función diseñados y transformados que serán recibidos en Amazon SageMaker.
    • Un código de transformación de datos alojado en AWS Lambda para preparar los datos sin procesar para el consumo y el entrenamiento de modelos de ML, y transformar los datos de entrada y de salida.
    • Automatización de Amazon SageMaker a través de funciones Lambda para construir, administrar y crear puntos de enlace de REST para nuevos modelos, basados en una planificación o desencadenados por cambios de datos en el lago de datos.
    • Puntos de enlace de Amazon API Gateway para alojar API públicas para les permite a los desarrolladores obtener datos históricos y predicciones para sus aplicaciones.
    • Amazon Kinesis Data Streams para permitir un procesamiento en tiempo real de nuevos datos a través de las etapas de incorporación, modelado, mejoramiento y transformación.
    • Amazon Kinesis Data Firehose para emitir los resultados de las fases de modelado y mejoramiento para Amazon S3 para el almacenamiento duradero.
    • Un panel de Amazon CloudWatch para proporcionar el monitoreo de la transformación de datos, el entrenamiento del modelo y componentes para alojamiento para el punto de enlace de la predicción.
    • Un servidor de bloc de notas de AWS SageMaker para permitir la exploración de datos mediante un bloc de notas de Jupyter.
    • AWS Identity and Access Management (IAM) para aplicar el principio de mínimo privilegio en cada componente de procesamiento. La función y el acceso restringido a las políticas de IAM sólo para los recursos que sean necesarios.
    • Un escenario de demostración que construya y actualice un modelo predictivo para los precios de spot diarios de Amazon Elastic Compute Cloud (Amazon EC2).
  •  Cómo realizar la implementación
  • Puede construir un entorno para ciencia de datos predictivos con Amazon SageMaker y un lago de datos en AWS en unos 10-15 minutos siguiendo unos sencillos pasos:

    1. Si aún no tiene una cuenta de AWS, regístrese en https://aws.amazon.com.
    2. Inicie el Quick Start.
    3. (Opcional) Pruebe la implementación con el escenario de demostración proporcionado.
    4. (Opcional) Entrene un modelo de ML usted mismo.
  •  Costo y licencias
  • Deberá pagar el costo de los servicios de AWS que se utilicen para ejecutar esta implementación de referencia del Quick Start. No hay costos adicionales por el uso del Quick Start.

    En la plantilla de AWS CloudFormation para este Quick Start, se incluyen parámetros de configuración que puede personalizar. Con algunas de estas configuraciones, como el tipo de instancia, se verá afectado el costo de implementación. Consulte las páginas de precios de cada servicio de AWS que utilizará para obtener estimaciones de costos. Los precios pueden modificarse.

    Dado que este Quick Start utiliza servicios de AWS nativos, no se requieren licencias adicionales.

  •  Recursos
  • La implementación de referencia de este Quick Start está vinculada con la solución destacada en Solution Space que incluye un resumen de la solución, productos de asesoramiento opcionales desarrollados por socios con competencias de AWS y la inversión conjunta de AWS en los proyectos de prueba de concepto (PoC). Para obtener más información sobre estos recursos, visite el Espacio de soluciones.