Inizia a usare Amazon Machine Learning

Crea un account gratuito

Ricevi dodici mesi di accesso al piano gratuito di AWS e sfrutta le funzionalità di supporto di base di AWS, inclusi l'assistenza clienti 24x7x365, i forum di supporto e molto altro.

Amazon Machine Learning non è attualmente disponibile nel piano gratuito di AWS.

D: Che cos'è Amazon Machine Learning?

Amazon Machine Learning è un servizio di Machine Learning che ti permette di creare applicazioni predittive, con caratteristiche, tra le altre, di rilevamento delle frodi, previsione della domanda e stima dei clic. Amazon Machine Learning utilizza potenti algoritmi che ti aiutano a creare modelli di Machine Learning individuando gli schemi ricorrenti nei dati esistenti e utilizzando tali schemi per generare stime dai nuovi dati non appena si rendono disponibili. La Console di gestione AWS e l'API offrono strumenti di visualizzazione di dati e modelli, nonché procedure guidate che ti aiutano a completare il processo di creazione di modelli di Machine Learning, misurandone la qualità e ottimizzando le stime in modo da soddisfare i requisiti della tua applicazione. Dopo aver creato i modelli, puoi ottenere le stime per la tua applicazione utilizzando la semplice API, senza dover implementare alcun codice di generazione di stime personalizzato o gestire alcuna infrastruttura. Amazon Machine Learning è altamente scalabile e può generare miliardi di stime, rendendole disponibili in tempo reale e a un throughput elevato. Con Amazon Machine Learning non sono previsti costi di configurazione e puoi pagare in base al consumo, per poter iniziare al minimo e dimensionare la soluzione parallelamente alla crescita della tua applicazione.

D: Che cosa è possibile fare con Amazon Machine Learning?

Puoi utilizzare Amazon Machine Learning per creare un'ampia gamma di applicazioni predittive. Ad esempio, puoi utilizzare Amazon Machine Learning per semplificare la creazione di applicazioni in grado di contrassegnare le transazioni sospette, rilevare gli ordini fraudolenti, prevedere la domanda, personalizzare i contenuti, prevedere l'attività degli utenti, filtrare le recensioni, ascoltare i social media, analizzare testo eterogeneo e consigliare articoli.

D: Che cos'è Machine Learning?

Machine Learning (ML) è una tecnologia che semplifica l'utilizzo dei dati cronologici per adottare decisioni aziendali consapevoli. Gli algoritmi ML sono in grado di individuare gli schemi ricorrenti nei dati e creare modelli matematici utilizzando tali schemi. Quindi, puoi utilizzare i modelli per generare stime sui dati futuri. Una possibile applicazione di Machine Learning consiste ad esempio nel rilevare le transazioni fraudolente in base a esempi di acquisti precedenti corretti o non riusciti.

D: Come si inizia a utilizzare Amazon Machine Learning?

Il modo migliore per iniziare a utilizzare Amazon Machine Learning consiste nel seguire il tutorial all'interno del documento Amazon Machine Learning Developer Guide. Questo tutorial ti aiuta a completare la creazione di un modello di Machine Learning da un set di dati di esempio, la valutazione del modello e il suo utilizzo per creare stime. Al termine del tutorial, potrai utilizzare Amazon Machine Learning per creare i tuoi modelli ML. Per ulteriori informazioni, consulta il documento Amazon Machine Learning Developer Guide e le informazioni di riferimento sulle API di Amazon Machine Learning.

D: Che cosa sono i dati di training?

I dati di training vengono utilizzati per creare modelli di Machine Learning e sono costituiti da punti dati noti generati in passato. Puoi utilizzare Amazon Machine Learning per estrarre gli schemi ricorrenti da tali dati e utilizzarli per creare modelli di Machine Learning.

D: Che cos'è l'attributo di destinazione?

L'attributo di destinazione è un attributo speciale nei dati di training che contiene le informazioni che Amazon Machine Learning tenta di stimare. Ad esempio, supponiamo di voler creare un modello in grado di stimare se una transazione sia o meno fraudolenta. I dati di training contengono i metadata su una transazione precedente con attributo di destinazione "1" se la transazione è stata rifiutata dalla banca o "0" in caso contrario. Puoi utilizzare Amazon Machine Learning per individuare gli schemi ricorrenti che correlano l'attributo di destinazione ai metadata della transazione (tutti gli altri attributi). Puoi utilizzare i modelli ML basati su tali schemi per generare una stima senza la presenza dell'attributo di destinazione. In questo esempio si tratta di stimare se una transazione sia o meno fraudolenta in base ai metadata associati, prima di sapere se verrà rifiutata o accettata dalla banca.

D: Quale algoritmo viene utilizzato da Amazon Machine Learning per generare modelli?

Amazon Machine Learning utilizza attualmente un algoritmo di regressione logistica standard del settore per generare modelli.

D: In quali regioni AWS è disponibile Amazon Machine Learning?

Per un elenco completo delle regioni AWS supportate da Amazon Machine Learning, consulta la tabella delle regioni AWS per l'intera infrastruttura globale AWS.  Per ulteriori informazioni, consulta inoltre la pagina di regioni ed endpoint nella sezione delle informazioni di riferimento generali su AWS.

D: Qual è la disponibilità del servizio Amazon Machine Learning?

Amazon Machine Learning è progettato per offrire disponibilità elevata. Non sono previsti tempi di inattività pianificati o finestre di manutenzione. L'API per il training dei modelli, la valutazione e le stime in batch viene eseguita nei collaudati data center a disponibilità elevata di Amazon, con replica dello stack di servizi configurata fra tre strutture in ogni regione AWS per offrire tolleranza ai guasti in caso di guasto di un server o di interruzione del servizio nella zona di disponibilità.

D: Quali misure di sicurezza vengono applicate da Amazon Machine Learning?

Amazon Machine Learning assicura la crittografia dei modelli ML e di altri elementi del sistema inattivi o in transito. Le richieste all'API e alla console di Amazon Machine Learning vengono effettuate tramite una connessione sicura (SSL). Puoi utilizzare AWS Identity and Access Management (AWS IAM) per definire gli utenti di IAM autorizzati ad accedere a operazioni e risorse specifiche di Amazon Machine Learning.

Torna all'inizio >>

D: Dove posso archiviare i miei dati?

Puoi utilizzare Amazon Machine Learning per leggere i dati da tre archivi dati: (a) uno o più file in Amazon S3, (b) i risultati di una query Amazon Redshift oppure (c) i risultati di una query Amazon Relational Database Service (RDS) eseguita su un database in esecuzione con il motore MySQL. I dati generati da altri prodotti possono in genere essere esportati in file CSV in Amazon S3 perché Amazon Machine Learning possa accedervi. Per istruzioni dettagliate sulla configurazione dei permessi che consentono ad Amazon Machine Learning di accedere agli archivi dati supportati, consulta il documento Amazon Machine Learning Developer Guide.

D: Le dimensioni del data set che è possibile utilizzare per il training sono limitate?

Amazon Machine Learning può eseguire il training di modelli in set di dati di dimensioni fino a 100 GB.

D: Come si determina se i dati contengono errori?

Puoi utilizzare Amazon Machine Learning per rilevare eventuali errori di formattazione dei dati. La caratteristica di analisi dei dati della console del servizio Amazon Machine Learning ti aiuta a individuare errori più complessi all'interno dei dati, ad esempio eventuali campi vuoti o contenenti valori imprevisti. Amazon Machine Learning è in grado di eseguire il training di modelli ML e di generare stime accurate in presenza di un numero ridotto di entrambi i tipi di errori dei dati, permettendo la corretta esecuzione delle tue richieste anche se alcune osservazioni dei dati non sono valide o corrette.

D: Che cosa si può fare se i dati sono incompleti o alcune informazioni risultano mancanti?

È sempre consigliabile assicurarsi che i dati siano quanto più completi e accurati possibile. Gli algoritmi di Amazon Machine Learning tollerano quantità ridotte di informazioni incomplete o mancanti senza influire negativamente sulla qualità dei modelli. Con l'aumentare del numero di errori, tuttavia, la qualità del modello risultante risulterà inferiore. Amazon Machine Learning interrompe l'elaborazione della richiesta di training del modello se il numero di record che non vengono elaborati è maggiore di 10.000 o del 10% rispetto a tutti i record nel set di dati, a seconda della situazione che si verifica per prima.

Per correggere informazioni incomplete o mancanti, devi tornare all'origine dati master e correggere i dati al suo interno oppure escludere le osservazioni con informazioni incomplete o mancanti dal set di dati utilizzato per il training dei modelli Amazon Machine Learning. Ad esempio, se riscontri che alcune righe in una tabella Amazon Redshift contengono valori non validi, puoi modificare la query utilizzata per selezionare i dati perché Amazon Machine Learning escluda tali righe.

D: Come si determina se il modello produce stime accurate?

Amazon Machine Learning include potenti caratteristiche di valutazione dei modelli. Puoi utilizzare Amazon Machine Learning per calcolare un parametro di valutazione standard del settore per qualsiasi modello, in modo da determinare la qualità predittiva di tali modelli. Puoi utilizzare Amazon Machine Learning anche per garantire l'obiettività della valutazione dei modelli scegliendo di mantenere una parte dei dati di training solo per scopi di valutazione, in modo da evitare che il modello venga valutato con punti dati già osservati in fase di training. La console del servizio Amazon Machine Learning offre potenti strumenti semplici da utilizzare per esplorare e comprendere i risultati delle valutazioni dei modelli.

D: Come si esegue il tuning del modello se non produce i risultati desiderati?

Il modo migliore per incrementare la qualità di un modello consiste nell'utilizzare dati di qualità e quantità superiori per il training. L'aggiunta di un numero maggiore di osservazioni e di altri tipi di informazioni (caratteristiche) e la trasformazione dei dati per ottimizzare il processo di Machine Learning (progettazione delle caratteristiche) sono tutti metodi validi per migliorare l'accuratezza predittiva di un modello. Puoi utilizzare Amazon Machine Learning per creare molti modelli prototipo e puoi avvalerti dei processori di dati integrati di Amazon Machine Learning per rendere diversi tipi di progettazione delle caratteristiche tanto semplici quanto la modifica di una riga nel linguaggio di "ricette" predefinito. Amazon Machine Learning può inoltre creare automaticamente una ricetta di trasformazione dei dati consigliata in base ai tuoi dati quando crei un nuovo oggetto origine dati che punta ai tuoi dati. Tale ricetta verrà automaticamente ottimizzata in base al contenuto dei dati.

Amazon Machine Learning offre inoltre diversi parametri per il tuning del processo di Machine Learning: (a) dimensioni di destinazione del modello, (b) numero di passaggi da eseguire sui dati e (c) tipo e livello di regolarizzazione da applicare al modello. Le impostazioni predefinite di Amazon Machine Learning supportano perfettamente molte attività ML reali, ma possono essere modificate nel modo necessario utilizzando la console o l'API del servizio.

Infine, un aspetto importante da considerare riguardo al tuning del modello è il modo in cui le stime generate dal modello ML vengono interpretate dalla tua applicazione, per allinearle in misura ottimale agli obiettivi aziendali. Amazon Machine Learning ti aiuta a modificare il punteggio limite di interpretazione per modelli di classificazione binaria, in modo da realizzare un equilibrio consapevole tra i diversi tipi di errori possibili per un modello di training. Ad esempio, alcune applicazioni hanno un'elevata tolleranza agli errori falsi positivi, mentre gli errori falsi negativi sono altamente indesiderati. La console del servizio Amazon Machine Learning semplifica la modifica del limite di punteggio in base a questo requisito. Per ulteriori informazioni, consulta la sezione sulla valutazione dei modelli ML del documento Amazon Machine Learning Developer Guide.

D: È possibile esportare i modelli esternamente ad Amazon Machine Learning?

No.

D: È possibile importare modelli esistenti in Amazon Machine Learning?

No.

D: Amazon Machine Learning deve eseguire una copia permanente dei dati per creare modelli di Machine Learning?

No. Amazon Machine Learning deve poter accedere in sola lettura ai tuoi dati per individuare ed estrarre gli schemi ricorrenti al loro interno e archiviarli nei modelli ML. I modelli ML non sono copie dei tuoi dati. Nell'accedere a dati archiviati in Amazon Redshift o Amazon RDS, Amazon Machine Learning esporta i risultati delle query in una posizione di tua scelta in S3 e quindi legge tali risultati da S3. Manterrai la proprietà completa di questa copia temporanea dei dati e potrai rimuoverla al termine dell'operazione di Amazon Machine Learning.

Torna all'inizio >>

D: Quando il modello è pronto, come si ottengono le stime per le applicazioni?

Puoi utilizzare Amazon Machine Learning per recuperare le stime in due modi: utilizzando l'API per le stime in batch o l'API per le stime in tempo reale. L'API per le stime in batch viene utilizzata per richiedere stime per un numero elevato di record di dati di input, opera offline e restituisce tutte le stime simultaneamente. L'API per le stime in tempo reale viene utilizzata per richiedere stime per singoli record di dati di input e restituisce le stime immediatamente. Questa API può essere utilizzata a un throughput elevato, per generare più stime contemporaneamente in risposta a richieste parallele.

Qualsiasi modello ML creato con Amazon Machine Learning può essere utilizzato tramite l'API per le stime in batch o l'API per le stime in tempo reale. La scelta dipende solo da te e dai requisiti dell'applicazione. In genere devi utilizzare l'API per le stime in batch per le applicazioni che operano su record di dati in blocco e l'API per le stime in tempo reale per applicazioni Web, mobili e desktop interattive.

D: Con quale velocità l'API per le stime in tempo reale di Amazon Machine Learning può generare stime?

La maggior parte delle richieste di stime in tempo reale restituisce una risposta entro 100 ms, una velocità sufficiente per applicazioni Web, mobili o desktop interattive. Il tempo esatto necessario all'API per le stime in tempo reale per generare una stima varia a seconda delle dimensioni dei record di dati di input e della complessità della "ricetta" di elaborazione dei dati associata al modello ML che genera le stime.

D: Quante richieste simultanee dell'API per le stime in tempo reale supporta Amazon Machine Learning?

A ogni modello ML abilitato per le stime in tempo reale è assegnato l'URL di un endpoint. Per impostazione predefinita, puoi richiedere fino a 200 transazioni al secondo da qualsiasi endpoint delle stime in tempo reale. Se questo limite non è sufficiente per le esigenze della tua applicazione, contatta il supporto clienti.

D: Con quale rapidità Amazon Machine Learning può restituire le stime in batch?

L'API per le stime in batch è rapida ed efficiente. Il tempo necessario per restituire i risultati delle stime in batch dipende da diversi fattori, tra cui (a) dimensioni dei dati di input, (b) complessità della "ricetta" di elaborazione dei dati associata al modello ML che genera le stime e (c) numero di altri processi in batch (elaborazione di dati, training di modelli, valutazione e altre richieste di elaborazione in batch) eseguiti contemporaneamente nel tuo account. Per impostazione predefinita, Amazon Machine Learning esegue fino a cinque processi in batch simultaneamente. Se questo limite non è sufficiente per le esigenze della tua applicazione, contatta il supporto clienti.

D: Come si monitorano le prestazioni delle stime?

Il monitoraggio delle prestazioni delle stime assume due forme: (a) monitoraggio del volume del traffico di stime in batch e in tempo reale e (b) monitoraggio della qualità dei modelli predittivi.

Puoi monitorare il volume del traffico di stime consultando i parametri di Amazon CloudWatch pubblicati da Amazon Machine Learning nel tuo account CloudWatch. Per ogni ID modello ML che ha ricevuto stime in batch o in tempo reale durante il periodo di monitoraggio, Amazon Machine Learning pubblica il numero di record di dati per cui le stime sono state generate correttamente e il numero di record ML la cui analisi non è riuscita e di conseguenza non ha prodotto alcuna stima.

Per monitorare la qualità del modello ML nel tempo, una best practice del settore consiste nell'acquisire regolarmente un esempio casuale di record di dati inviati dall'applicazione per la stima, ottenere le risposte reali (chiamate anche "destinazioni") e quindi utilizzare Amazon Machine Learning per creare una valutazione del set di dati risultante. Amazon Machine Learning calcola il parametro di qualità di un modello confrontando le destinazioni con le stime generate. Se riscontri che la qualità dei parametri si è ridotta nel tempo, questo problema può essere indicativo del fatto che devi eseguire il training di un nuovo modello con nuovi punti dati, in quanto i dati utilizzati in origine per il training del modello non corrispondono più al mondo reale. Ad esempio, se utilizzi il modello ML per rilevare le transazioni fraudolente, potresti riscontrare un calo di qualità nel tempo a causa della comparsa di nuovi metodi di frode, ignoti al momento del training del modello. Puoi contrastare questa tendenza eseguendo il training di un nuovo modello ML, con esempi delle transazioni fraudolente più recenti, per consentire ad Amazon Machine Learning di individuare, tra gli altri elementi, gli schemi ricorrenti che identificano tali transazioni.

Torna all'inizio >>