Distribuzione di riferimento

Data science predittiva con Amazon SageMaker e un data lake in AWS

Memorizza e trasforma i dati per la creazione di applicazioni predittive e prescrittive

Questo Quick Start crea un ambiente di data lake per la creazione, la formazione e l'implementazione di modelli di Machine Learning (ML) con Amazon SageMaker nel cloud di Amazon Web Services (AWS). La distribuzione, che richiede circa 10-15 minuti, utilizza servizi AWS quali Amazon Simple Storage Service (Amazon S3), Amazon API Gateway, AWS Lambda, Amazon Kinesis Data Stream e Amazon Kinesis Data Firehose.

Amazon SageMaker è una piattaforma gestita che consente a sviluppatori e data scientist di creare, addestrare e distribuire modelli di ML in modo rapido e semplice.

Il Quick Start è rivolto a utenti che vogliono utilizzare al meglio la potenza dei dati per creare modelli predittivi e prescrittivi per promuovere il valore aziendale, senza dover configurare cluster complessi di hardware per il ML. Inoltre, abilita la data science end-to-end, partendo da dati non elaborati e arrivando a una API REST di previsione in un sistema di produzione.

Il Quick Start offre anche uno scenario dimostrativo sviluppato da Pariveda Solutions. Lo scenario mostra come: archiviare dati non elaborati in Amazon S3, trasformarli per il consumo con Amazon SageMaker, utilizzare Amazon SageMaker per creare un modello di ML e ospitarlo in un'API di previsione a prezzi Spot di Amazon Elastic Compute Cloud (Amazon EC2).

pariveda-data-lake-sagemaker-LP-logo

Questo Quick Start è stato sviluppato da Pariveda Solutions, Inc., in collaborazione con AWS. Pariveda è un Partner APN.

Consulta tutte le soluzioni AWS »
  •  Attività che realizzerai
  •  Come effettuare la distribuzione
  •  Costi e licenze
  •  Risorse
  •  Attività che realizzerai
  • Questa architettura di Quick Start crea quanto segue:

    • Un data lake strutturato in Amazon S3 per mantenere i dati non elaborati, modellati, migliorati e trasformati.
    • Un bucket temporaneo per i dati sviluppati per certe funzionalità e trasformati, che verranno importati in Amazon SageMaker.
    • Il codice di trasformazione dei dati, ospitato su AWS Lambda, per preparare i dati non elaborati al consumo e all’addestramento di modelli ML e per trasformare l’input e l’output dei dati.
    • L’automazione di Amazon SageMaker tramite funzioni Lambda per creare e gestire endpoint REST per nuovi modelli basati su un programma o attivati da modifiche ai dati nel data lake.
    • Endpoint di Amazon API Gateway per ospitare API pubbliche volte a consentire agli sviluppatori di ottenere una cronologia dei dati o previsioni per le loro applicazioni.
    • Amazon Kinesis Data Streams per abilitare l’elaborazione in tempo reale di nuovi dati durante i passaggi di importazione, modellazione, miglioramento e trasformazione.
    • Amazon Kinesis Data Firehose per raggiungere i risultati delle fasi di modellazione e miglioramento di Amazon S3 per uno storage durevole.
    • Un pannello di controllo Amazon CloudWatch per fornire monitoraggio della trasformazione dei dati, dell’addestramento dei modelli e dei componenti di hosting per l’endpoint di previsione.
    • Un server notebook AWS SageMaker per abilitare l’esplorazione dei dati utilizzando un notebook Jupyter.
    • AWS Identity and Access Management (IAM) per imporre il principio del privilegio minimo su ciascun componente di elaborazione. Il ruolo e la policy IAM limitano l’accesso solo alle risorse necessarie.
    • Uno scenario dimostrativo che crea e aggiorna un modello di previsione a prezzi Spot giornalieri di Amazon Elastic Compute Cloud (Amazon EC2).
  •  Come effettuare la distribuzione
  • Puoi creare il tuo ambiente di data science predittiva con Amazon SageMaker e un data lake in AWS in circa 10-15 minuti seguendo alcuni semplici passaggi:

    1. Se non disponi ancora di un account AWS, registrati su https://aws.amazon.com.
    2. Avvia Quick Start.
    3. (Facoltativo) Esegui il test della distribuzione utilizzando lo scenario dimostrativo fornito.
    4. (Facoltativo) Addestra un modello ML autonomamente.
  •  Costi e licenze
  • Ti saranno addebitati i costi dei servizi AWS utilizzati per eseguire questa distribuzione di riferimento Quick Start. Non sono previsti costi aggiuntivi per l'utilizzo del Quick Start.

    Il modello AWS CloudFormation per questo Quick Start include alcuni parametri di configurazione personalizzabili. Alcune di queste impostazioni, ad esempio il tipo di istanza, incideranno sul costo della distribuzione. Per una stima dei costi, consulta la pagina dei prezzi di ciascuno dei servizi AWS che intendi utilizzare. I prezzi sono soggetti a modifiche.

    Poiché questo Quick Start utilizza servizi AWS nativi, non sarà necessaria alcuna altra licenza.

  •  Risorse
  • Questa distribuzione di riferimento di Quick Start è relativa a una soluzione presente in Solution Space che include una descrizione della soluzione, offerte di consulenza opzionali realizzate dai partner del programma AWS Competency Program e co-investimento AWS in progetti proof of concept (PoC). Per ulteriori informazioni su queste risorse, visita Solution Space.