Publicado en: Sep 5, 2018
Amazon S3: presentación de mejoras para características en S3 Select. S3 Select es una funcionalidad de Amazon S3 diseñada para extraer solo los datos que necesita de un objeto, lo que puede mejorar sustancialmente el rendimiento y reducir el costo de las aplicaciones que necesitan obtener acceso a los datos almacenados en S3.
En la actualidad, Amazon S3 Select funciona con objetos almacenados en formatos CSV y JSON. Gracias a los comentarios de los clientes, hoy nos complace anunciar la compatibilidad de S3 Select con el formato Apache Parquet, las matrices de JSON y la compresión BZIP2 para CSV y los objetos JSON. También estamos incorporando compatibilidad con las métricas de CloudWatch para S3 Select, que le permiten monitorear el uso de S3 Select para sus aplicaciones.
El nivel de adopción de Parquet es muy amplio porque admite una gran variedad de motores de consultas, como Hive, Presto e Impala, así como también numerosos marcos, incluidos Spark y MapReduce. S3 Select Parquet le permite usar S3 Select para recuperar columnas específicas de datos almacenados en S3 y, además, admite la compresión en columnas con GZIP o Snappy. Puede especificar el formato de los resultados como CSV o JSON y determinar de qué manera se delimitarán los registros en el resultado.
Mediante la compatibilidad con matrices JSON, puede iterar en nodos internos en los objetos JSON. Puede realizar consultas en estos objetos JSON anidados si especifica la ruta de navegación en la cláusula FROM de las consultas de S3 Select.
BZIP2 es un formato de compresión con un alto nivel de adopción que se utiliza para comprimir datos de textos y, normalmente, es más eficiente que muchos otros tipos de algoritmos de compresión.
Las métricas de CloudWatch para S3 le permiten realizar un seguimiento del estado de las aplicaciones. Las métricas se encuentran disponibles con intervalos de 1 minuto y le permiten identificar y reaccionar rápidamente ante problemas operativos. Las nuevas métricas específicas para S3 Select incluyen total de solicitudes, volumen de datos escaneados y volumen de datos devueltos de S3 Select.
Estas características para Amazon S3 Select están disponibles en todas las regiones comerciales de AWS a partir de hoy.
Si desea obtener más información sobre Amazon S3 Select, visite la página Selección de contenido de los objetos en la guía para desarrolladores de Amazon S3. Si desea obtener más información sobre las métricas de Amazon CloudWatch para S3, visite la página Monitorización de métricas con Amazon CloudWatch en la guía para desarrolladores de Amazon S3. Para comenzar, visite la consola de administración de AWS.