Publicado en: Apr 1, 2022
Los clientes de AWS Glue DataBrew ahora pueden limpiar y transformar datos almacenados en el formato de almacenamiento en columnas y filas Optimized Row Columnar (ORC), un formato ampliamente utilizado para almacenar datos de Hive. Al crear un conjunto de datos en AWS Glue DataBrew, ahora puede utilizar archivos ORC además del resto de formatos de archivo compatibles: Apache Parquet, Microsoft Excel, CSV y JSON.
Consulte Tipos de archivo admitidos para orígenes de datos en la Guía para desarrolladores de AWS Glue DataBrew para ver una lista de los formatos de entrada admitidos.
Actualizado el 11 de abril de 2022: esta publicación mencionaba de manera errónea a Apache Avro como formato compatible. A partir de esta fecha, AWS Glue DataBrew no admite Apache Avro como formato de entrada.