Inserito il: Jul 19, 2019
La funzionalità di trasformazione in batch di Amazon SageMaker consente di eseguire previsioni su set di dati memorizzati in Amazon S3. È ideale per gli scenari in cui si lavora con grandi quantità di dati per i quali non sia necessaria una latenza inferiore al secondo. È ora possibile configurare i tuoi processi di trasformazione in batch per escludere determinati attributi di dati dalle richieste di stima e per associare alcuni o tutti gli attributi di input ai risultati delle previsioni. Di conseguenza, non è più necessaria la pre-elaborazione o la post-elaborazione aggiuntiva durante l'esecuzione di previsioni in batch su dati in formato CSV o JSON.
Ad esempio, prendi in esame un set di dati che include tre attributi: ID, età e altezza. L'attributo ID è un numero generato in modo casuale o sequenziale che non mostra alcun segnale relativo al problema ML e non è stato utilizzato durante l'addestramento del modello di machine learning. È ora possibile configurare processi di trasformazione in batch per escludere l'attributo ID da ogni record e trasmettere solo gli attributi età e altezza nelle richieste di previsione inviate al modello. È inoltre possibile configurare tali processi per associare l'attributo ID ai risultati di previsione nell'output finale S3 del processo. Mantenere gli attributi a livello di record con questa modalità può essere utile per analizzare i risultati delle previsioni.
Questa nuova funzionalità è offerta in tutte le regioni AWS in cui SageMaker è disponibile. Per ulteriori informazioni su questa funzionalità, consulta la guida per sviluppatori di Amazon SageMaker.