Publicado: Jul 25, 2023
Agora, o Amazon SageMaker Canvas oferece suporte a cinco novas transformações de dados para aprimorar a preparação e análise dos dados antes da criação de modelos de machine learning(ML). Os dados são a base do machine learning. Para obter melhores insights, é fundamental transformar dados brutos para adequá-los à criação de modelos de ML e gerar previsões. A partir de hoje, o SageMaker Canvas permite que você altere o tipo de dados das colunas entre numérico, texto e data e hora, além de exibir o atributo associado a esses tipos de dados, como binário e categórico. Esse recurso oferece a flexibilidade de alterar manualmente o tipo de dados das colunas com base nos atributos. A capacidade de escolher o tipo certo de dados garante a integridade e a precisão dos dados antes da criação de modelos de ML. Como exemplo, usar o tipo de dados de data e hora garante que somente datas válidas sejam armazenadas nessa coluna específica.
Além disso, o Canvas permite que você execute a reamostragem de dados de séries temporais, estabelecendo intervalos regulares para as observações em conjuntos de dados de séries temporais. Isso é muito útil quando dados de séries temporais contêm observações com espaçamento irregular. A reamostragem desses dados ajudará você a espaçá-los igualmente entre intervalos de tempo regulares, aumentando sua utilidade para operações posteriores, como análises e previsões. Por fim, o Canvas otimizou o gerenciamento de linhas de dados com recursos de classificação em ordem crescente ou decrescente, embaralhamento aleatório e eliminação de linhas duplicadas.
Esses novos recursos de transformação de dados estão disponíveis em todas as regiões da AWS com suporte para o Canvas. Para saber mais, consulte a documentação do produto.