Crea con Amazon SageMaker
Amazon SageMaker semplifica la creazione di modelli di machine learning e la relativa preparazione all'addestramento fornendo tutto il necessario per etichettare rapidamente i dati di addestramento e selezionare e ottimizzare l'algoritmo e il framework migliori per ogni applicazione.
Funzionalità
Esperienza collaborativa con i notebook
I notebook Amazon SageMaker Studio sono notebook Jupyter con capacità di calcolo elastiche che possono essere ruotati rapidamente e con un semplice clic. I notebook contengono tutto il necessario per eseguire o ricreare un flusso di lavoro di machine learning e sono integrati in Amazon SageMaker Studio. I notebook sono precaricati con tutti i driver CUDA e cuDNN comuni, i pacchetti Anaconda e le librerie di framework.
L'ambiente del notebook consente di esplorare e visualizzare i dati e documentare i risultati in flussi di lavoro riutilizzabili. È possibile importare i dati già memorizzati in Amazon S3 direttamente dal notebook. È anche possibile utilizzare AWS Glue per trasferire dati da Amazon RDS, Amazon DynamoDB e Amazon Redshift in S3 per consentirne l'analisi.
Crea dataset di addestramento accurati
Amazon SageMaker Ground Truth consente ai clienti di creare dataset di addestramento estremamente accurati utilizzando il machine learning e di ridurre i costi di etichettatura dei dati fino al 70%. I modelli di machine learning validi vengono addestrati utilizzando dati etichettati per istruire il modello a prendere decisioni corrette. Il completamento di questo processo spesso può richiedere mesi e l'impiego di team di grandi dimensioni. SageMaker Ground Truth fornisce una soluzione innovativa per ridurre i costi e la complessità e nel contempo migliora l'accuratezza dell'etichettatura dei dati utilizzando il machine learning insieme a un processo di etichettatura umana denominato apprendimento attivo.

Elaborazione dei dati completamente gestita su vasta scala
Molto spesso, i carichi di lavoro di elaborazione e analisi dei dati per il machine learning vengono eseguiti su un'infrastruttura autogestita che è difficile da allocare e ridimensionare, man mano che i requisiti aziendali cambiano. L'uso di diversi strumenti per raggiungere questo obiettivo diventa difficile da gestire con conseguenti prestazioni non ottimali e maggiori spese capitali e operative. Amazon SageMaker Processing supera questo problema estendendo la facilità, la scalabilità e l'affidabilità di SageMaker a un'esperienza completamente gestita nell'esecuzione di carichi di lavoro di elaborazione dati su larga scala. SageMaker Processing consente di connettersi all'archiviazione esistente o alle origini dati sul file system, aumentare le risorse necessarie per eseguire il lavoro, salvare l'output in un archivio permanente e fornire i log e le metriche. È inoltre possibile utilizzare container con i framework di propria scelta e sfruttare i carichi di lavoro di elaborazione dati e analisi dei dati esistenti.
Algoritmi integrati ad alte prestazioni
Amazon SageMaker fornisce algoritmi di machine learning scalabili e ad alte prestazioni, ottimizzati per ottenere velocità, scalabilità e precisione, che possono effettuare addestramenti su dataset su scala del petabyte. È possibile scegliere tra algoritmi supervisionati le cui risposte corrette sono note durante l'addestramento e correggere successivamente gli errori. Amazon SageMaker include algoritmi supervisionati quali XGBoost e classificazione o regressione lineare/logistica per risolvere i problemi relativi a previsioni di serie temporali e suggerimenti. Amazon SageMaker include inoltre il supporto per l'apprendimento non supervisionato (ovvero algoritmi che devono trovare la risposta corretta senza un intervento manuale), ad esempio il clustering k-means e l'analisi delle componenti principali (PCA), per risolvere problemi quali l'identificazione di gruppi di clienti in base ai comportamenti di acquisto.
Ampio supporto per i framework
Amazon SageMaker supporta molti framework popolari per il deep learning come TensorFlow, Apache MXNet, PyTorch, Chainer e altri. Questi framework vengono automaticamente configurati e ottimizzati per prestazioni elevate. Non è necessario impostare manualmente questi framework e puoi utilizzarli all'interno dei container integrati. Tuttavia, è sempre possibile importare un framework personalizzato in Amazon SageMaker creando un container Docker apposito e memorizzandolo in Amazon EC2 Container Registry.
Prova e creazione di prototipi in locale
I container Docker open source Apache MXNet e Tensorflow utilizzati in Amazon SageMaker sono disponibili su GitHub. È possibile scaricare i container in un ambiente locale e utilizzare Python SDK di Amazon SageMaker per provare gli script prima di distribuirli agli ambienti di addestramento o hosting di Amazon SageMaker. Nel momento in cui è necessario passare dal testing in locale all'addestramento e hosting in produzione, è sufficiente modificare una riga di codice.
Apprendimento per rinforzo
Amazon SageMaker supporta il l'apprendimento per rinforzo oltre al tradizionale apprendimento supervisionato e non supervisionato. SageMaker dispone ora di algoritmi di apprendimento per rinforzo preimpostati completamente gestiti, compresi quelli più recenti e con le migliori prestazioni secondo la letteratura accademica. SageMaker supporta l'apprendimento per rinforzo in più framework, inclusi TensorFlow e MXNet, e nei framework più recenti progettati da zero per l'apprendimento per rinforzo come Intel Coach e Ray RL. Sono supportati vari ambienti di simulazione fisica 2D e 3D, inclusi quelli basati sull'interfaccia open source OpenGym. Inoltre, SageMaker RL consentirà la formazione mediante ambienti 3D virtuali integrati in Amazon Sumerian e Amazon RoboMaker. Per iniziare a utilizzarlo, SageMaker fornisce anche una gamma di notebook e tutorial di esempio.
Risorse
Una guida passo passo per costruire modelli di machine learning
Scopri come costruire modelli di ML su Amazon SageMaker.
Notebook di esempio in Amazon SageMaker
Accedi a un ricco repository di notebook Amazon SageMaker su GitHub.