Amazon SageMaker Canvas já oferece suporte à importação de fluxos de dados e à preparação mais rápida de dados para ML
Agora, o Amazon SageMaker Data Wrangler no Amazon SageMaker Canvas oferece suporte à importação de fluxos de dados do Amazon SageMaker Studio Classic e à preparação de dados mais rápida e flexível para machine learning (ML). Com a versão mais recente do SageMaker Data Wrangler no SageMaker Canvas, ficou mais fácil importar dados do S3 com delimitadores personalizados e mais opções de amostragem, além da melhor performance na preparação de dados. Você também pode validar transformações com mais rapidez e iterar facilmente nas fórmulas de dados. Você também pode importar fluxos de dados do SageMaker Studio Classic para aproveitar os atributos e aprimoramentos mais recentes de preparação de dados no SageMaker Canvas.
Agregar, analisar e transformar grandes quantidades de dados é a parte mais demorada de um projeto de ML, pois é um processo altamente iterativo e repetitivo. Com esses novos aprimoramentos, você pode importar dados com diferentes métodos de amostragem, como top-k, aleatório ou estratificado, e ajustar o tamanho e o método da amostra conforme necessário para obter uma amostra representativa. Você pode transformar dados com menor latência, validar rapidamente o impacto das transformações no tamanho dos dados e reordenar as etapas conforme necessário. Além disso, você pode copiar uma fórmula de dados e substituir as fontes de dados para reutilizá-la com diferentes conjuntos de dados e modelos. Por último, mas não menos importante, você pode importar com um clique todos os fluxos de dados existentes do SageMaker Data Wrangler no SageMaker Studio Classic para o SageMaker Canvas ou importar manualmente fluxos de dados específicos por meio do S3 ou de uploads de arquivos locais.
Esses novos recursos de preparação de dados estão disponíveis em todas as regiões da AWS com suporte para o SageMaker Canvas. Para obter mais informações, consulte o blog e a documentação técnica da AWS.