Publicado en: Jun 30, 2023

Amazon SageMaker Canvas ahora admite el formato de archivo Apache Parquet, lo que permite formatos de archivo adicionales para conjuntos de datos tabulares, de previsión de series temporales y de NLP. SageMaker Canvas es una interfaz visual que permite a los analistas de negocios generar predicciones de ML precisas por su cuenta, sin la necesidad de contar con experiencia en esta tecnología ni de escribir líneas de código.

A partir de hoy, Canvas es compatible con Apache Parquet, un formato de archivos de datos de código abierto orientado a columnas diseñado para el almacenamiento y la recuperación eficientes de datos. Con esta nueva capacidad, puede importar datos mediante el formato de archivos Parquet, además de archivos CSV para casos de uso tabulares, de previsión de series temporales, y de procesamiento del lenguaje natural (NLP), lo que le brinda una mayor flexibilidad. Al crear un conjunto de datos en Canvas, puede elegir varios archivos Parquet de su disco local o de su bucket de Amazon S3. Cada archivo Parquet puede tener un tamaño de hasta 5 GB. Con esquemas de compresión y codificación eficientes, los archivos Parquet maximizan la eficacia del uso de datos en Canvas para importar datos, crear modelos de ML y generar predicciones.

La compatibilidad con Apache Parquet está disponible en todas las regiones de AWS en las que actualmente se admite SageMaker Canvas. Para obtener más información, consulte la documentación del producto.