Amazon SageMaker Canvas ora supporta l'importazione dei flussi di dati e una preparazione più rapida dei dati per il machine learning

Inserito il: 20 ago 2024

Amazon SageMaker Data Wrangler in Amazon SageMaker Canvas ora supporta l'importazione di flussi di dati da Amazon SageMaker Studio Classic, nonché una preparazione dei dati più rapida e flessibile per il machine learning (ML). Con l'ultima versione di SageMaker Data Wrangler in SageMaker Canvas, ora puoi importare i dati da S3 più facilmente con delimitatori personalizzati e più opzioni di campionamento e preparare i dati con prestazioni migliorate. Inoltre, puoi convalidare le trasformazioni più velocemente ed eseguire facilmente l'iterazione delle ricette di dati. Puoi importare i flussi di dati da SageMaker Studio Classic per usufruire delle più recenti funzionalità di preparazione dei dati e ottimizzazioni in SageMaker Canvas.

L'aggregazione, l'analisi e la trasformazione di grandi quantità di dati costituiscono l’aspetto più dispendioso in termini di tempo di un progetto di machine learning a causa della natura altamente iterativa e ripetitiva del processo. Questi miglioramenti consentono di importare dati con diversi metodi di campionamento, ad esempio top-k, casuale o stratificato, e regolare la dimensione del campione e il metodo di campionamento in base alle necessità per ottenere un campione rappresentativo. Puoi trasformare i dati con una latenza inferiore, convalidare rapidamente l'impatto delle trasformazioni sulla dimensione dei dati e riorganizzare le fasi del flusso di lavoro in base alle esigenze. Inoltre, puoi copiare una ricetta di dati e sostituire le origini dati per riutilizzarla per diversi set di dati e modelli. Infine, ma non meno importante, puoi importare con un clic tutti i flussi di dati esistenti da SageMaker Data Wrangler in SageMaker Studio Classic a SageMaker Canvas o importare manualmente flussi di dati specifici tramite S3 o caricamenti di file locali.

Queste nuove funzionalità di preparazione dei dati migliorate sono disponibili in tutte le regioni AWS in cui SageMaker Canvas è supportato. Per ulteriori informazioni, consulta il blog e la documentazione tecnica di AWS.