Inserito il: Dec 3, 2019
Amazon SageMaker Autopilot è ora disponibile. Con questa funzionalità, Amazon SageMaker può utilizzare i tuoi dati tabulari e le colonne di destinazione che specifichi per addestrare e ottimizzare automaticamente i tuoi modelli, il tutto fornendoti una completa visibilità sul processo. Come suggerito dal nome, puoi utilizzarlo con il "pilota automatico" distribuendo il modello con la massima precisione con un solo clic in Amazon SageMaker Studio, oppure come guida per prendere delle decisioni, permettendoti di fare degli scambi, come la precisione con la latenza o le dimensioni del modello.
Molto spesso è difficile determinare quale algoritmo ML funzionerà meglio per un certo set di dati, ed è altrettanto difficile trovare i parametri dell'algoritmo adatti. Inoltre, devi sistemare i dati e pre-elaborarli per poter creare dei buoni modelli di ML. Questo processo richiede molto tempo e a volte anche delle grandi abilità nel machine learning. Il risultato spesso è che i team prendono delle scorciatoie e utilizzano soluzioni temporanee come l'utilizzo di un set di dati così com'è invece di sistemare o pre-elaborare i dati. Alla fine, i team utilizzano gli algoritmi più facili rispetto a quelli più corretti per il problema che devono risolvere. Di conseguenza, le aziende non riescono a ottenere la qualità del modello desiderata. Inoltre, i data scientist con conoscenze profonde in quanto a ML passano molto tempo a sperimentare diversi modelli di ML prima di trovare quello migliore per il problema che devono risolvere, specialmente per le applicazione come quelle pubblicitarie o IoT, che hanno molti vincoli per quanto riguarda le dimensioni del modello e la latenza.
Amazon SageMaker Autopilot semplifica tutto questo processo e rende il machine learning più semplice, più veloce e più trasparente. Ora puoi creare modelli di classificazione e regressione senza conoscenze di machine learning: devi solo fornire un set di dati tabulare e selezionare la colonna di destinazione da prevedere. SageMaker Autopilot esplora automaticamente le soluzioni di machine learning con diverse combinazioni di preprocessori di dati, algoritmi e impostazioni di parametri degli algoritmi per trovare il modello più preciso. Invece di lasciarti decidere quale algoritmo utilizzare, SageMaker Autopilot seleziona automaticamente l'algoritmo giusto da un elenco di algoritmi ad alte prestazioni che supporta a livello nativo e li valuta tutti. SageMaker Autopilot, inoltre, prova automaticamente diverse impostazioni di parametri su questi algoritmi per ottenere la migliore qualità del modello. Adesso puoi distribuire direttamente il modello migliore alla produzione con un solo clic, oppure puoi valutare vari candidati per cambiare i parametri come la precisione, la latenza e la dimensione del modello. Non devi preoccuparti della pulizia dei dati e della pre-elaborazione: SageMaker Autopilot applica automaticamente diversi tipi di preprocessori di dati sui dati prima di passarli attraverso l'algoritmo per addestrare il modello.
Amazon SageMaker Autopilot è ore disponibile nelle regioni AWS Stati Uniti orientali (Ohio), Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (California settentrionale), Stati Uniti occidentali (Oregon), Asia Pacifico (Mumbai), Asia Pacifico (Seoul), Asia Pacifico (Singapore), Asia Pacifico (Sydney), Asia Pacifico (Tokyo), Canada (Centrale), UE (Francoforte), UE (Irlanda), UE (Londra), UE (Parigi) e UE (Stoccolma). Consulta la pagina della documentazione per ulteriori informazioni su SageMaker Autopilot e leggi il post del blog per scoprire come utilizzare SageMaker Autopilot per le tue attività di creazione del modello.