Funzionalità di Amazon SageMaker Canvas

Crea modelli ML estremamente accurati utilizzando un'interfaccia visiva, senza bisogno di codice

Sviluppo ML basato su chat con Amazon Q Developer

Amazon Q Developer aiuta a colmare il divario tra le sfide aziendali e i modelli ML. Traduce abilmente i problemi aziendali in flussi di lavoro ML dettagliati e spiega i termini ML utilizzando un linguaggio non tecnico.

Amazon Q Developer guida abilmente gli utenti in ogni fase dello sviluppo del modello, dalla preparazione dei dati alla creazione, all’addestramento e all’implementazione dei modelli ML. Utilizzando un'interfaccia di chat, Amazon Q Developer fornisce assistenza contestuale e aiuta gli utenti a navigare nel flusso di lavoro ML end-to-end per creare modelli ML pronti per la produzione.

Il generatore di pipeline deterministico di Amazon Q Developer e le tecniche avanzate AutoML supportano la riproducibilità e l'accuratezza nella creazione del modello. Fornendo agli utenti funzionalità di data science avanzate, Q Developer consente una sperimentazione rapida mantenendo la fiducia nell'utilità del modello.

Amazon Q Developer conserva artefatti come set di dati originali e trasformati, oltre alle pipeline di preparazione dei dati create utilizzando il linguaggio naturale. Inoltre, i modelli creati utilizzando Q Developer possono essere registrati in SageMaker Model Registry e i notebook dei modelli possono essere esportati per un’ulteriore personalizzazione e integrazione.

Preparazione dei dati

SageMaker Canvas si connette a più di 50 origini dati; in alternativa puoi caricare file locali per addestrare il tuo modello ML. Sono supportati dati tabulari, di immagini o di testo. Puoi anche scrivere query per le origini dati utilizzando SQL e importare i dati direttamente in SageMaker da vari formati di file, come CSV, Parquet, ORC e JSON, nonché da tabelle di database.
Tramite l'interfaccia senza codice di SageMaker Canvas puoi esplorare, visualizzare e analizzare i dati utilizzando visualizzazioni integrate o personalizzate. Con un solo clic puoi generare il rapporto Data Quality and Insight per verificare la qualità dei dati, ad esempio assicurandoti che il set di dati non contenga valori mancanti o righe duplicate, e rilevare anche anomalie come valori anomali, squilibrio di classe e perdita di dati.
SageMaker Canvas offre una selezione di oltre 300 trasformazioni di dati predefinite basate su PySpark, in modo da poter trasformare i dati senza scrivere una sola riga di codice. In alternativa puoi utilizzare l'interfaccia chat basata su modelli di base per preparare i tuoi dati.
SageMaker Canvas semplifica l'avvio o la pianificazione di un flusso di lavoro di preparazione dei dati, per elaborarli rapidamente e dimensionare la loro preparazione tra set di dati, esportarli su un notebook SageMaker Studio o integrarli con SageMaker Pipelines.

Accesso e creazione di modelli ML

Tramite l'interfaccia senza codice di SageMaker Canvas puoi creare automaticamente modelli ML personalizzati utilizzando i tuoi dati aziendali. Dopo aver selezionato e preparato i dati e identificato ciò che desideri prevedere, SageMaker Canvas identifica il tipo di problema, testa centinaia di modelli ML in base al tipo di problema (utilizzando tecniche ML come regressione lineare, regressione logistica, deep learning, previsione di serie temporali e aumento del gradiente) e crea un modello personalizzato che effettua le previsioni più accurate in base al tuo set di dati. In alternativa puoi migrare il tuo modello creato in precedenza su SageMaker Canvas e distribuire il modello per l'inferenza.

SageMaker Canvas fornisce l'accesso a modelli tabulari, NLP e CV pronti all'uso per casi d'uso, tra cui l'analisi del sentiment, il rilevamento di oggetti nelle immagini, il rilevamento del testo nelle immagini e l'estrazione di entità. I modelli pronti all'uso non richiedono lo sviluppo di modelli e sono alimentati dai servizi di intelligenza artificiale AWS, tra cui Amazon Rekognition, Amazon Textract e Amazon Comprehend.

Dopo aver creato il modello, puoi valutare le prestazioni del modello prima di distribuirlo in produzione utilizzando i dati aziendali. Puoi confrontare facilmente le risposte dei modelli e selezionare la risposta migliore per le tue esigenze.

SageMaker Canvas fornisce l'accesso a modelli di fondazione (FM) pronti all'uso per la generazione di contenuti, l'estrazione e il riepilogo del testo. È possibile accedere a modelli di fondazione (FM) come Claude 2, Llama-2, Amazon Titan, Jurassic-2 e Command (con tecnologia Amazon Bedrock), nonché FM disponibili al pubblico come Falcon, Flan-T5, Mistral, Dolly ed MPT (con tecnologia SageMaker JumpStart) e ottimizzarli quindi utilizzando i propri dati.

Generazione di previsioni di ML

SageMaker Canvas offre un'analisi visiva ipotetica, che consente di modificare gli input del modello e quindi comprendere in che modo le modifiche influiscono sulle singole previsioni. Puoi creare previsioni in batch automatiche per un intero set di dati e, quando il set di dati viene aggiornato, il tuo modello ML viene aggiornato automaticamente. Dopo l'aggiornamento del modello ML, puoi esaminare le previsioni aggiornate dall'interfaccia senza codice di SageMaker Canvas.

È possibile distribuire il modello SageMaker Canvas sugli endpoint SageMaker per l'inferenza in tempo reale.

Condividi le previsioni dei modelli con Amazon QuickSight per creare dashboard che combinano business intelligence tradizionale e dati predittivi nella stessa grafica interattiva. Inoltre, i modelli SageMaker Canvas possono essere condivisi e integrati direttamente in QuickSight, consentendo agli analisti di generare previsioni estremamente accurate per i nuovi dati all'interno di una dashboard QuickSight.

Sfruttamento dei MLOps

È possibile registrare i modelli ML creati in SageMaker Canvas nel SageMaker Model Registry con un solo clic per integrare il modello nei processi CI/CD di implementazione dei modelli esistenti.

Puoi condividere i modelli SageMaker Canvas con i data scientist che utilizzano SageMaker Studio. I data scientist possono esaminare, aggiornare e condividere i modelli aggiornati con te o implementare il tuo modello per l'inferenza.