Publicado: Apr 1, 2022
Os clientes do AWS Glue DataBrew agora podem limpar e transformar dados armazenados no formato de arquivo Optimized Row Columnar (ORC), um formato de dados amplamente usado para armazenar dados do Hive. Ao criar um conjunto de dados no AWS Glue DataBrew, agora você pode usar arquivos ORC além dos formatos de arquivo Apache Parquet, Microsoft Excel, CSV e JSON já compatíveis.
Para obter uma lista de formatos de entrada compatíveis, consulte Tipos de arquivo compatíveis para origem dos dados, no Guia do desenvolvedor do AWS Glue DataBrew.
Atualizado em 11 de abril de 2022. Esta postagem listou incorretamente o Apache Avro como um formato de entrada compatível. A partir desta data, o AWS Glue DataBrew não oferece compatibilidade com o Apache Avro como formato de entrada.