Publicado: Jun 30, 2021
Agora, o AWS Glue DataBrew oferece suporte à capacidade de gravar conjuntos de dados criados a partir de trabalhos que executam suas receitas de preparação de dados diretamente no AWS Glue Data Catalog. Você pode optar por armazenar conjuntos de dados nas tabelas do Amazon S3, Amazon Redshift e Amazon RDS (Aurora, Oracle, SQL Server, MySQL e PostgreSQL) no Data Catalog.
Com esse recurso, agora você pode catalogar diretamente seus dados limpos e normalizados ao criar seu data warehouse ou data lake. O Data Catalog conterá um índice para as métricas de local, esquema e tempo de execução dos dados.
Para começar, acesse o Console de Gerenciamento da AWS ou instale o plugin do DataBrew em seu ambiente Notebook e consulte a documentação do DataBrew.