Publicado: Oct 6, 2021
O Amazon SageMaker Data Wrangler reduz o tempo para agregação e preparação de dados para machine learning (ML) de semanas para minutos. Com o SageMaker Data Wrangler, é possível simplificar o processo de preparação de dados e engenharia de recursos e concluir cada etapa do fluxo de trabalho de preparação de dados, incluindo seleção, limpeza, exploração e visualização de dados em uma única interface visual.
A partir de hoje, você pode usar os novos recursos do Amazon SageMaker Data Wrangler que facilitam e agilizam a preparação de dados para ML, incluindo uma nova coleção de transformações de série temporal e duas novas visualizações de série temporal para gerar rapidamente insights a partir dos seus dados de série temporal. As novas transformações de série temporal oferecem suporte a atribuições de valores ausentes, caracterização de séries temporais (por exemplo, coeficientes de Fourier, estatísticas de autocorrelação, entropia etc.), operadores de reamostragem para reduzir ou aumentar a amostragem de conjuntos de dados para uma frequência uniforme, recursos de intervalo de tempo e funções de janela contínua. As novas transformações também oferecem suporte a operações mais gerais, como agrupamento, unificação de comprimento, nivelamento e exportação de colunas com valores vetoriais.
Além disso, agora você pode visualizar a sazonalidade e as tendências nos seus dados e identificar anomalias com novas visualizações de séries temporais no Amazon SageMaker Data Wrangler. Por exemplo, com a sazonalidade e a visualização de tendências, você pode separar os efeitos sazonais das tendências em seus dados de vendas. Além disso, com a visualização de detecção de valores discrepantes, você pode identificar valores discrepantes nos seus conjuntos de dados de compra do cliente para detectar alterações no comportamento de compra do cliente.
Para começar a usar os novos recursos do Amazon SageMaker Data Wrangler, você pode abrir o Amazon SageMaker Studio depois de fazer upgrade para a versão mais recente e clicar em File > New > Flow (Arquivo > Novo > Fluxo) no menu ou em “New Data Flow” (Novo Fluxo de Dados) no launcher do SageMaker Studio. Para saber mais sobre as novas transformações e visualizações de série temporal, visualize a documentação.