Publicado: Jul 19, 2019
O Amazon SageMaker Batch Transform permite executar previsões em conjuntos de dados armazenados no Amazon S3. O serviço é ideal em cenários de trabalho com grandes lotes de dados que não precisam de latência inferior a um segundo. Agora, você pode configurar as tarefas do Batch Transform para excluir determinados atributos de dados das solicitações de previsão e para associar alguns ou todos os atributos dos dados de entrada aos resultados de previsões. Como resultado, não é mais necessário executar processamento adicional antes ou depois da execução de previsões de dados nos formatos CSV ou JSON.
Por exemplo, considere um conjunto de dados que inclui três atributos: ID, idade e altura. O atributo ID é um número sem sinal, sequencial ou gerado aleatoriamente, para uso pelo problema de ML, e não foi usado no treinamento do modelo de ML. Agora, você pode configurar as tarefas do Batch Transform para excluir o atributo de ID de cada registro e passar apenas os atributos de idade e altura às solicitações de previsão enviadas ao modelo. Você também pode configurar as tarefas do Batch Transform para associar o atributo de ID aos resultados de previsões na saída final do S3 para a tarefa. A retenção de atributos de registro dessa forma pode ser útil para a análise dos resultados de previsões.
Esse novo recurso está disponível em todas as regiões em que o Amazon SageMaker está disponível. Para saber mais sobre esse recurso, consulte o guia do desenvolvedor do Amazon SageMaker.