Domande generali

D: Cos'è Amazon SageMaker?

Amazon SageMaker è un servizio completamente gestito che consente a data scientist e sviluppatori di creare, formare e distribuire in modo rapido e semplice modelli di apprendimento automatico.

D: Cosa è possibile fare con Amazon SageMaker?

Amazon SageMaker permette a sviluppatori e data scientist di dare vita a modelli di apprendimento automatico da usare in app intelligenti e predittive.

D: Come si inizia a usare Amazon SageMaker?

Per iniziare a usare Amazon SageMaker, è necessario eseguire l'accesso nella relativa console, lanciare un'istanza notebook con uno dei notebook di esempio, modificarla collegando origini dati personalizzate, seguire gli esempi per creare, formare e convalidare i modelli e distribuire il risultato in produzione in pochi passaggi.

D: in quali regioni è disponibile Amazon SageMaker?

Per un elenco completo delle regioni AWS supportate da Amazon SageMaker, consulta la tabella delle regioni AWS per l'infrastruttura globale AWS. Per ulteriori informazioni, consulta inoltre la pagina Regioni ed endpoint nel documento AWS General Reference.

D: È possibile ottenere uno storico di tutte le chiamate alle API di Amazon SageMaker effettuate sull'account per analizzare la sicurezza e per la risoluzione dei problemi operativi? 

Sì. Per ricevere uno storico delle chiamate API Amazon SageMaker effettuate sul tuo account, è sufficiente attivare AWS CloudTrail nella Console di gestione AWS. Le seguenti chiamate API nel runtime di Amazon SageMaker *non vengono registrate e inoltrate: InvokeEndpoint.

D: Quali livelli di disponibilità offre Amazon SageMaker?

Amazon SageMaker è progettato per offrire disponibilità elevata. Non sono previsti finestre di manutenzione o tempi di inattività pianificati. L'API Amazon SageMaker viene eseguita nei data center sicuri e ad elevata disponibilità di Amazon, con replica dello stack di servizi configurata fra tre strutture in ogni regione AWS per offrire tolleranza ai guasti in caso di inattività di un server o di interruzione del servizio nella zona di disponibilità.

D: Quali misure di sicurezza implementa Amazon SageMaker?

Amazon SageMaker crittografa gli artefatti di modello di apprendimento automatico e di altri elementi del sistema, sia inattivi sia in transito. Le richieste all'API e alla console di Amazon SageMaker vengono inoltrate tramite una connessione sicura (SSL). È possibile avvalersi di ruoli AWS Identity and Access Management in Amazon SageMaker per assegnare automaticamente autorizzazioni di accesso alle risorse per formazione e distribuzione. È anche possibile utilizzare bucket S3 per dati e artefatti di modello, nonché applicare una chiave KMS a notebook di Amazon SageMaker, processi di addestramento ed endpoint per crittografare i volumi di storage dedicati all'apprendimento automatico.

D: In che modo Amazon SageMaker protegge il codice?

Amazon SageMaker memorizza il codice in volumi di storage per l'apprendimento automatico, protetti da gruppi di sicurezza crittografabili su disco.

D: Come viene fatturato l'utilizzo di Amazon SageMaker?

Verranno addebitati i costi delle risorse di storage e di elaborazione dati e apprendimento automatico utilizzate per hosting del notebook, addestramento di modelli, elaborazione di previsioni e registrazione dei risultati. Amazon SageMaker permette di selezionare il numero e il tipo di istanze da utilizzare per il notebook in hosting, l'addestramento e l'hosting del modello. I prezzi sono calcolati solo in base all'uso effettivo, senza tariffe minime né impegni anticipati.

D: Se invece è già presente un notebook o un ambiente di addestramento o hosting?

Amazon SageMaker offre un flusso di lavoro completo, ma è sempre possibile continuare a utilizzare gli strumenti esistenti insieme al servizio. Trasferire i risultati di ciascuna fase da o verso Amazon SageMaker secondo le esigenze aziendali è molto semplice.

Notebook Jupyter in hosting

D: Quali tipi di notebook sono supportati?

Al momento sono supportati i notebook Jupyter.

D: In che modo è possibile conservare i file del notebook una volta chiuso lo spazio di lavoro?

Per conservare i file del notebook è possibile utilizzare il volume di storage di apprendimento automatico collegato. Tale volume sarà scollegato quando l'istanza del notebook viene arrestata e ricollegato quando l'istanza viene riavviata. Gli elementi in memoria non saranno conservati.

D: In che modo è possibile aumentare le risorse disponibili per il notebook?

Per modificare l'istanza notebook e selezionare un profilo di maggior respiro, è possibile utilizzare la console di Amazon SageMaker, salvando i file e i dati sul volume di storage di apprendimento automatico collegato. L'istanza notebook sarà riavviata e avrà a disposizione maggiori risorse e gli stessi file e librerie.

D: In che modo è possibile addestrare un modello da un notebook di Amazon SageMaker?

Una volta avviato un notebook di esempio, è possibile personalizzarlo in base a origini dati e schema ed eseguire le API AWS per i processi di creazione e addestramento. È possibile consultare l'avanzamento del processo di addestramento nella console di Amazon SageMaker o tramite le API AWS.

Addestramento di modelli

D: Cos'è Managed Spot Training?

Managed Spot Training con Amazon SageMaker ti consente di addestrare i modelli di machine learning utilizzando le istanze Spot di Amazon EC2, riducendo al contempo il costo dell'addestramento fino al 90%.

D: In che modo è possibile utilizzare Managed Spot Training?

Puoi abilitare l'opzione Managed Spot Training durante l'invio dei tuoi processi di addestramento e specificare quanto a lungo desideri attendere per la capacità Spot. Amazon SageMaker gestisce la capacità Spot e utilizza le istanze Spot di Amazon EC2 per eseguire i tuoi processi. Avrai completa visibilità sullo stato del processo di addestramento, sia quando è in esecuzione sia quando è in attesa di capacità disponibile.

D: In quali casi è indicato utilizzare Managed Spot Training?

Managed Spot Training è ideale quando hai la flessibilità di scegliere il momento in cui eseguire i processi di addestramento e per ridurre al minimo il loro costo. Con Managed Spot Training puoi ridurre il costo dell'addestramento dei modelli di machine learning fino al 90%.

D: Come funziona Managed Spot Training?

Managed Spot Training utilizza le istanze Spot di Amazon EC2 per l'addestramento. Queste istanze possono essere annullate nel caso in cui sia necessaria capacità per AWS. Come risultato, i processi di Managed Spot Training possono essere eseguiti in piccoli incrementi non appena la capacità diventa disponibile. I processi di addestramento non devono essere riavviati da zero in caso di interruzione, in quanto Amazon SageMaker può ripristinarli utilizzando l'ultimo checkpoint del modello. I framework e gli algoritmi di visione computerizzata integrati in Amazon SageMaker consentono di creare checkpoint periodici da poter abilitare con i modelli personalizzati.

D: Con Managed Spot Training è necessario creare checkpoint periodicamente?

Consigliamo di creare checkpoint periodici come procedura consigliata generale per i processi di addestramento con esecuzione prolungata. In questo modo è possibile evitare il riavvio dei processi di Managed Spot Training in caso di annullamento della capacità. Abilitando i checkpoint, Amazon SageMaker ripristina i processi di Managed Spot Training dall'ultimo checkpoint. 

D: In che modo è possibile calcolare il risparmio sui costi con i processi di Managed Spot Training?

Quando completi un processo di Managed Spot Training, puoi visualizzare il risparmio nella Console di gestione AWS e calcolare il risparmio sui costi anche come differenza percentuale tra la durata di esecuzione del processo di addestramento e la durata per la quale hai ricevuto la fattura.

Indipendentemente dal numero di interruzioni dei processi di Managed Spot Training, i costi ti verranno addebitati solo una volta in base alla quantità di dati scaricati.

D: Quali istanze si possono utilizzare con Managed Spot Training?

La funzione Managed Spot Training può essere utilizzata con tutte le istanze supportate in Amazon SageMaker.

D: Quali regioni di AWS sono supportate con Managed Spot Training?

Managed Spot Training è supportato in tutte le regioni di AWS nelle quali Amazon SageMaker è attualmente disponibile.

D: Sono previste limitazioni per il set di dati utilizzabile per l'addestramento?

Non sono previsti limiti fissi alle dimensioni del set di dati utilizzabile per l'addestramento di modelli con Amazon SageMaker.

D: Quali origini dati è possibile estrarre in Amazon SageMaker?

Durante la creazione di un processo di addestramento, è possibile specificare il percorso dei dati di addestramento in Amazon S3.

D: Quali algoritmi usa Amazon SageMaker per generare modelli?

Amazon SageMaker include di default algoritmi per regressione lineare, regressione logistica, clustering k-medie, analisi delle componenti principali, macchine di fattorizzazione, topic modeling neurale, allocazione latente di Dirichlet, alberi con gradient boosting, sequence2sequence, previsione di serie storiche, word2vec e classificazione di immagini. Amazon SageMaker offre inoltre container Apache MXNet, Tensorflow, Chainer e PyTorch ottimizzati. Infine, Amazon SageMaker supporta gli algoritmi di addestramento personalizzati tramite immagini Docker conformi alle specifiche documentate.

D: Cos'è l'ottimizzazione automatica dei modelli

La maggior parte degli algoritmi di apprendimento automatico impiegano una serie di parametri che controllano il funzionamento dell'algoritmo sottostante. Questi parametri vengono in genere chiamati iperparametri; i loro valori influenzano la qualità dei modelli addestrati. L'ottimizzazione automatica dei modelli è il processo di ricerca di un set di iperparametri di un algoritmo che offrano un modello ottimale.

D: A quali modelli può essere applicata l'ottimizzazione automatica dei modelli?

È possibile eseguire l'ottimizzazione di modelli in Amazon SageMaker su qualsiasi algoritmo purché sia scientificamente fattibile, ad esempio algoritmi integrati in SageMaker, reti neurali profonde o algoritmi arbitrari caricati in Amazon SageMaker sotto forma di immagini Docker.

D: È possibile utilizzare l'ottimizzazione automatica dei modelli al di fuori di Amazon SageMaker?

No, al momento no. Esperienza e prestazioni di ottimizzazione del modello sono migliori nell'ambito di Amazon SageMaker.

D: In cosa consiste l'algoritmo di ottimizzazione sottostante?

Al momento, il nostro algoritmo per l'ottimizzazione degli iperparametri è un'implementazione ottimizzata dell'ottimizzazione baynesiana. Il suo scopo è l'ottimizzazione dei parametri secondo un obiettivo stabilito dal cliente. In particolare, verifica i parametri di oggetto per i processi di addestramento completati e sfrutta i dati ottenuti per dedurre la combinazione di iperparametri per il processo di addestramento successivo.

D: Sono previsti suggerimenti per l'ottimizzazione di specifici iperparametri?

No. Il modo in cui i singoli iperparametri alterano le prestazioni di un modello dipende da diversi fattori e non è semplice stabilire se un iperparametro sia più importante di altri e debba essere quindi modificato. Per gli algoritmi in Amazon SageMaker, è già stabilito quali iperparametri possono essere ottimizzati.

D: Quanto tempo richiede un processo di ottimizzazione di iperparametri?

La durata di un processo di ottimizzazione degli iperparametri dipende da diversi fattori, tra cui le dimensioni dei dati, l'algoritmo sottostante e i valori degli iperparametri. Inoltre, i clienti potranno scegliere il numero di processi di addestramento simultanei e il numero totale. Tutte queste scelte influenzano la durata del processo di ottimizzazione. 

D: È possibile ottimizzare diversi obiettivi simultaneamente, ad esempio ottenendo un modello sia rapido sia preciso?

No, al momento no. È necessario specificare un singolo obiettivo di ottimizzazione, oppure modificare il codice dell'algoritmo in modo che emetta un nuovo parametro, che sarà confrontato con altri parametri per applicarvi il processo di addestramento secondo il nuovo obiettivo.

D: Quanto costa l'ottimizzazione automatica dei modelli?

Per il processo di ottimizzazione di per sé non è previsto alcun costo. Saranno tuttavia addebitati i costi dei processi di addestramento avviati dal processo di ottimizzazione, secondo le tariffe di addestramento dei modelli.

D: Cos'è il consolidamento dell'apprendimento?

Il consolidamento dell'apprendimento è una tecnica di Machine Learning che consente a un agente di imparare in un ambiente interattivo tramite prove ed errori utilizzando feedback dalle proprie azioni ed esperienze.

D: Posso formare i modelli di consolidamento dell'apprendimento in Amazon SageMaker?

Sì, è possibile formare i modelli di consolidamento dell'apprendimento in Amazon SageMaker oltre ai tradizionali modelli di apprendimento supervisionato e non supervisionato.

D: In cosa è diverso il consolidamento dell'apprendimento dall'apprendimento supervisionato?

Sebbene sia l'apprendimento supervisionato che il consolidamento dell'apprendimento utilizzino la mappatura tra input e output, nell'apprendimento supervisionato il feedback fornito all'agente è un insieme di azioni corretto per eseguire un'attività, mentre il consolidamento dell'apprendimento utilizza un feedback ritardato dove i segnali di ricompensa sono ottimizzati per assicurare un obiettivo a lungo termine tramite una sequenza di azioni.

D: Quando è indicato utilizzare il consolidamento dell'apprendimento?

Mentre l'obiettivo delle tecniche di consolidamento dell'apprendimento è di trovare la risposta esatta in base ai modelli nei dati di training, l'obiettivo delle tecniche di apprendimento non supervisionato è di trovare similitudini e differenze tra i punti di dati. Al contrario, l'obiettivo delle tecniche di consolidamento dell'apprendimento è di imparare come ottenere un risultato desiderato anche quando non è chiaro come raggiungere tale risultato. Di conseguenza, il consolidamento dell'apprendimento è più adatto per abilitare le applicazioni intelligenti dove un agente può prendere decisioni autonome come nella robotica, veicoli autonomi, HVAC, controllo industriale e altro.

D: Che tipo di ambienti possono utilizzare per formare i modelli di consolidamento dell'apprendimento?

Amazon SageMaker RL supporta un numero di ambienti diversi per la formazione di modelli di consolidamento dell'apprendimento. È possibile utilizzare i servizi AWS come AWS RoboMaker, gli ambienti open source o personalizzati sviluppato utilizzando le interfacce Open AI Gym o gli ambienti di simulazione commerciale come MATLAB e SimuLink.

D: Devo scrivere i miei algoritmi di agente RL per formare i modelli di consolidamento dell'apprendimento?

No, Amazon SageMaker RL include i kit di strumenti RL come Coach e Ray RLLib che offrono implementazioni o algoritmi di agente RL come DQN, PPO, A3C e molti altri.

D: Posso portare le mie librerie RL e l'implementazione di algoritmi ed eseguirli in Amazon SageMaker RL?

Sì, è possibile portare le librerie RL e le implementazione di algoritmi in Docker Containers ed eseguirle in Amazon SageMaker RL.

D: Posso effettuare rollout distribuiti utilizzando Amazon SageMaker RL?

Sì. È anche possibile selezionare un cluster eterogeneo in cui la formazione può essere eseguita su un'istanza GPU e le simulazioni possono essere eseguite su più istanze CPU.

D: Cos'è Amazon SageMaker Neo?

Amazon SageMaker Neo è una nuova funzionalità che consente di formare una sola volta i modelli di Machine Learning e di eseguirli ovunque nel cloud e nell'edge. SageMaker Neo ottimizza automaticamente i modelli costruiti con framework comuni di deep learning che possono essere utilizzati per la distribuzione su più piattaforme hardware. I modelli ottimizzati funzionano a una velocità doppia e consumano meno di un decimo delle risorse di modelli tradizionali di machine learning.


D: Come si inizia a usare Amazon SageMaker Neo?

Per iniziare a usare Amazon SageMaker Neo, è necessario eseguire l'accesso nella relativa console, scegliere un modello formato, seguire l'esempio per compilare i modelli e distribuire il modello risultante nella piattaforma hardware di destinazione.

 

D: Quali sono i componenti principali di Amazon SageMaker Neo?

Amazon SageMaker Neo contiene due componenti principali: un compilatore e un runtime. Prima, il compilatore Neo legge modelli esportati da diversi framework. Converte quindi le funzioni specifiche del framework e le operazioni in una rappresentazione intermedia indipendente dal framework. Inoltre, esegue una serie di ottimizzazioni. Quindi, il compilatore genera un codice binario per le operazioni ottimizzate e le scrive in una libreria di oggetti condivisa. Il compilatore salva inoltre la definizione del modello e i parametri in file separati. Durante l'esecuzione, il runtime Neo carica gli artefatti generati dal compilatore, definizione del modello, parametri e libreria di oggetti condivisa per eseguire il modello.


 

D: Devo utilizzare SageMaker per formare il mio modello e poter utilizzare Neo per convertire il modello?

No. È possibile formare modelli altrove e utilizzare Neo per ottimizzarli per le istanze ML SageMaker o i dispositivi supportati Greengrass. 

 

 

D: Quali modelli supporta SageMaker Neo?

Al momento, SageMaker Neo supporta i modelli di deep learning più conosciuti che alimentano le applicazioni di visione artificiale e i modelli di albero delle decisioni utilizzati in Amazon SageMaker oggi. Neo ottimizza le prestazioni dei modelli AlexNet, ResNet, VGG, Inception, MobileNet, SqueezeNet e DenseNet formati in MXNet e TensorFlow e i modelli Random Cut Forest formati in XGBoost.


 

 

D: Quali piattaforme supportano SageMaker Neo?

Al momento, Neo supporta le istanze SageMaker ML.C5, ML.C4, ML.M5, ML.M4, ML.P3 e ML.P2 e AWS DeepLens, Raspberry Pi e i dispositivi Jetson TX1 e TX2 e le CPU Intel® Atom e Intel® Xeon basate su dispositivi Greengrass, le CPU ARM Cortex-A e le GPU Nvidia Maxwell e Pascal.

 

 

 

D: Devo utilizzare una versione specifica di un framework supportato nell'hardware di destinazione?

No, Gli sviluppatori possono eseguire modelli che utilizzano il contenitore SageMaker Neo senza dipendente nel framework.

 

 

 

D: Quanto costa l'utilizzo di SageMaker Neo?

Viene pagato l'uso dell'istanza ML SageMaker che esegue l'inferenza utilizzando SageMaker Neo.

 

 

 

D: In quali regioni AWS è disponibile Amazon SageMaker Neo?

Al momento SageMaker Neo è disponibile nelle regioni AWS Virginia settentrionale, Oregon, Ohio e Irlanda. 

 

 

 

D: Che cos'è il monitoraggio dei modelli di Amazon SageMaker?

Il monitoraggio dei modelli di Amazon SageMaker consente di trovare e valutare rapidamente i training dei modelli più rilevanti tra centinaia e migliaia di processi di training dei modelli di Amazon SageMaker. SageMaker Search è disponibile in mediante la Console di gestione AWS e le API SDK AWS per Amazon SageMaker.

 

 

 

Q: Come posso organizzare e tracciare utilizzando i training dei modelli?

Con le funzionalità di monitoraggio dei modelli, è possibile cercare e organizzare i training dei modelli per ogni proprietà del processo di training scelto come l'ora di creazione del processo di training, l'URI del set di dati di training, valori di iperparametri o solo i metadati del processo di training. Un modo flessibile per organizzare e raggruppare i processi di training correlati insieme è di utilizzare i tag per etichettare i processi di training del modello. La ricerca di tag consente di trovare velocemente i training dei modelli associati a un progetto di business specifico, un laboratorio o un team di data science che consente di suddividere in categorie in modo significativo e di catalogare i training dei modelli.

 

 

 

D: Come posso creare una classifica di training utilizzando le funzionalità di monitoraggio dei modelli?

I processi di monitoraggio dei modelli vengono illustrati nella console di gestione AWS in formato tabulare, in modo simile a una classifica. Questo contiene tutti gli iperparametri e i parametri di training del modello presentate in colonne ordinabili. È possibile fare clic sull'intestazione della colonna per ordinare la classifica in base alle metriche di prestazioni oggetto della valutazione. È inoltre possibile confrontare e classificare rapidamente le sessioni di training in base a parametri delle prestazioni quali la perdita di training e l'accuratezza della convalida, creando così delle classifiche per la selezione di modelli "vincenti" per la distribuzione in ambienti di produzione.

 

 

 

D: Come traccio il modello o la derivazione dell'endpoint?

Andare a "Endpoint" sulla Console di gestione AWS per Amazon SageMaker e selezionare l'endpoint dall'elenco degli endpoint distribuiti. Scorrere fino a "Impostazioni configurazione endpoint" sulla pagina dell'endpoint scelto per vedere tutte le versioni del modello distribuite nell'endpoint. Accanto a ogni versione del modello, è possibile vedere un collegamento diretto al processo di training del modello che ha creato il modello in primo luogo.


 

 

 

Distribuzione di modelli

D: È possibile accedere all'infrastruttura su cui viene eseguito Amazon SageMaker?

No. Amazon SageMaker gestisce automaticamente l'infrastruttura di elaborazione, consentendo l'esecuzione di controlli dello stato, l'applicazione di patch di sicurezza e altre attività di manutenzione di routine. È anche possibile distribuire artefatti di modelli provenienti dai processi di addestramento con codice di inferenza personalizzato nell'ambiente di hosting aziendale.

D: In che modo è possibile ricalibrare le dimensioni e le prestazioni di un modello di Amazon SageMaker una volta avviata la fase di produzione?

L'hosting di Amazon SageMaker viene ricalibrato automaticamente mediante Application Auto Scaling in base alle prestazioni necessarie all'applicazione. Inoltre, è possibile modificare manualmente il tipo e il numero di istanze senza interrompere l'operatività apportando modifiche alla configurazione dell'endpoint.

D: In che modo è possibile monitorare l'ambiente di produzione di Amazon SageMaker?

Amazon SageMaker può inoltrare i propri parametri prestazionali in Amazon CloudWatch per permetterne il monitoraggio, per impostare allarmi e configurare operazioni da eseguire in base alle variazioni del traffico. Inoltre, Amazon SageMaker trascrive i propri log in Amazon CloudWatch Logs per favorire monitoraggio e risoluzione dei problemi negli ambienti di produzione.

D: Quali tipi di modelli possono essere conservati in hosting con Amazon SageMaker?

Amazon SageMaker è compatibile con l'hosting di qualsiasi modello conforme alle specifiche documentate per le immagini Docker di inferenza. Sono pertanto inclusi i modelli creati a partire da codice di inferenza e artefatti di modello di Amazon SageMaker.

D: Quante richieste simultanee in tempo reale dell'API supporta Amazon SageMaker?

Amazon SageMaker è stato progettato per ricalibrare le risorse fino a supportare un numero elevato di transazioni al secondo. Il numero preciso varia in base al modello distribuito e a tipo e numero di istanze in cui il modello è stato implementato.


D: Che cos'è la trasformazione in batch?

La trasformazione in batch permette di eseguire analisi predittive su batch di dati di piccole e grandi dimensioni. Non è necessario porzionare il set di dati o gestire gli endpoint in tempo reale. È possibile richiedere analisi predittive con una semplice API per un numero elevato di record di dati, eseguendone la trasformazione in modo rapido e semplice.

 

Ulteriori informazioni sui prezzi di Amazon SageMaker

Visita la pagina dei prezzi
Sei pronto per iniziare?
Registrati
Hai altre domande?
Contattaci