Publicado: Aug 29, 2022
O Amazon SageMaker Data Wrangler reduz o tempo de agregação e preparação de dados para machine learning (ML) de semanas para minutos no Amazon SageMaker Studio, o primeiro ambiente de desenvolvimento totalmente integrado (IDE) para ML. Com o SageMaker Data Wrangler, é possível simplificar o processo de preparação de dados e engenharia de recursos, além de executar cada etapa do fluxo de trabalho de preparação de dados, incluindo seleção, limpeza, exploração e visualização de dados em uma só interface visual. Os clientes podem usar o Data Wrangler para importar dados do Amazon S3, Amazon Athena, Amazon Redshift, Snowflake e Databricks Lakehouse Platform. Novas origens serão disponibilizadas em breve.
A partir de hoje, clientes iniciantes do Data Wrangler podem começar a usar o serviço em menos tempo usando o exemplo de conjunto de dados e seguindo etapas orientadas para navegar pelo produto pela primeira vez. O Data Wrangler oferece o Titanic, um conjunto de dados público amplamente utilizado para ensino e experimentos de ML, para que o cliente não precise importar seus próprios dados para começar a usar. Agora, o Data Wrangler sugere ações para ajudar usuários iniciantes a descobrir os principais recursos, como o relatório de qualidade e insights de dados, um recurso popular de verificação de qualidade e detecção de anormalidades em dados.
Para saber mais sobre como começar a usar o Amazon SageMaker Data Wrangler, acesse o blog ou a documentação da AWS.