Publicado en: Oct 13, 2021
Amazon Virtual Public Cloud (VPC) presenta tres nuevas características para que el almacenamiento y la ejecución de análisis de los registros de flujo de Amazon VPC sean más rápidos, sencillos y rentables. En primer lugar, los registros de flujo de VPC ahora se pueden entregar a Amazon S3 en el formato de archivo Apache Parquet. En segundo lugar, se pueden almacenar en S3 con prefijos compatibles con Hive. Y en tercer lugar, los registros de flujo de la VPC se pueden entregar como archivos con particiones por hora. Todas estas característica están disponibles cuando se elige S3 como destino de los registros de flujo de la VPC.
Las consultas de los registros de flujo de la VPC almacenados en formato Apache Parquet son más eficientes como resultado del formato compacto y en columnas de los archivos Parquet. Además, puede ahorrar en los costos de consulta mediante herramientas como Amazon Athena y Amazon Elastic Map Reduce (EMR), ya que las consultas se ejecutan más rápidamente y necesitan analizar un menor volumen de datos mediante archivos Parquet. Puede ahorrar hasta un 25 % en costos de almacenamiento en S3 debido a la mejor compresión en los archivos con formato Parquet, así como eliminar la necesidad de crear y administrar una aplicación de conversión de Apache Parquet. Los prefijos compatibles con Hive facilitan el descubrimiento y la carga de nuevos datos en las herramientas Hive, a la vez que los archivos de registro particionados por horas hacen más eficiente la consulta de registros en intervalos de tiempo específicos.
Para comenzar, cree una nueva suscripción a un registro de flujo de la VPC con S3 como destino y especifique las opciones de entrega de formato Parquet, prefijos compatibles con Hive o archivos con particiones por hora. Esta funcionalidad está disponible a través de la consola de administración de Amazon Web Services, la interfaz de línea de comandos de Amazon (Amazon CLI) y el kit de desarrollo de software de Amazon (Amazon SDK). Para obtener más información, consulte la documentación y lea la publicación en el blog. Consulte la página de precios de CloudWatch Logs para conocer el precio de la entrega de registros en formato Apache Parquet para los registros de flujo de la VPC.