Publicado: Dec 14, 2022
Hoje, temos o prazer de anunciar o lançamento de visualizações em nível de recurso geradas automaticamente no Amazon SageMaker Data Wrangler. O Amazon SageMaker Data Wrangler reduz de semanas para minutos o tempo de agregação e preparação de dados para machine learning (ML). Com o Data Wrangler, é possível simplificar o processo de preparação de dados e engenharia de recursos, além de executar cada etapa do fluxo de trabalho de preparação de dados, incluindo seleção, limpeza, exploração e visualização de dados em uma só interface visual. O Data Wrangler oferece uma variedade de opções de visualização configuráveis, desde visualizações gerais de dados, como histograma, gráfico de dispersão ou resumo da tabela, até visualizações avançadas, como detecção de anomalias ou decomposição de tendências sazonais para dados de séries temporais, vazamento de dados e viés de recursos para necessidades de machine learning.
A partir de hoje, o SageMaker Data Wrangler gera automaticamente visualizações para cada recurso no conjunto de dados. Você verá essas visualizações na parte superior de cada coluna do conjunto de dados depois que seu conjunto de dados for importado. Essa automação reduz ainda mais o trabalho pesado indiferenciado dos cientistas de dados, gerando automaticamente insights relacionados às distribuições de dados e à qualidade dos dados em nível de recurso.
Com as visualizações geradas automaticamente, você pode obter imediatamente insights relacionados a distribuições e tipos de dados sem escrever uma única linha de código. Os insights ajudam você a detectar facilmente problemas de qualidade de dados, como valores discrepantes, valores ausentes ou inválidos, etc., para cada coluna no conjunto de dados. Além disso, você também pode passar o mouse sobre as visualizações para ver estatísticas detalhadas, como contagem e porcentagem.
Esse recurso está disponível sem custo adicional e é ativado automaticamente em todas as regiões da AWS com suporte do Data Wrangler. Para saber mais, consulte o AWS News Blog e a documentação do produto do SageMaker Data Wrangler.