Publicado: Dec 8, 2020
O Amazon SageMaker Data Wrangler reduz o tempo para agregação e preparação de dados para machine learning (ML) de semanas para minutos. Com o Amazon SageMaker Data Wrangler, é possível simplificar o processo de preparação de dados e engenharia de recursos e concluir cada etapa do fluxo de trabalho de preparação de dados, incluindo seleção, limpeza, exploração e visualização de dados em uma única interface visual.
Para a maioria dos modelos de ML, podem ser necessárias semanas ou meses para agregar e preparar os dados de diferentes origens, converter, transformar e validar dados brutos em recursos que possam ser usados para treinar modelos e fazer previsões. É preciso escrever códigos para criar transformações de dados que possibilitem a conversão de dados em formatos que possam ser eficientemente usados em um modelo, e também escrever códigos adicionais que possam ser executados em escala em um grande número de fontes de dados: tempo muito mais bem gasto em tarefas de maior valor.
Com a ferramenta de seleção de dados do Amazon SageMaker Data Wrangler, é possível selecionar os dados desejados em diversas fontes de dados, incluindo Amazon S3, Amazon Athena, Amazon Redshift, AWS Lake Formation e a Loja de recursos do Amazon SageMaker, e importá-los com um único clique. O Amazon SageMaker Data Wrangler contém mais de 300 transformações de dados integradas para permitir a rápida normalização, transformação e combinação de recursos sem que seja necessário escrever qualquer código. Com os modelos de visualização do Amazon SageMaker Data Wrangler, é possível visualizar e verificar rapidamente se essas transformações foram concluídas conforme previsto visualizando-as no Amazon SageMaker Studio, primeiro ambiente de desenvolvimento totalmente integrado (IDE) para ML. Depois que os dados estiverem preparados, podem ser criados fluxos de trabalho de ML totalmente automatizados com pipelines do Amazon SageMaker e salvá-los na Loja de recursos do Amazon SageMaker.
O Amazon SageMaker Data Wrangler está disponível em todas as regiões em que o Amazon SageMaker Studio está disponível. Para começar a usar o Amazon SageMaker Data Wrangler, acesse nossa documentação.