Con AWS Glue, paga una tarifa por hora, que se factura por segundo, por los rastreadores (detección de datos) y los trabajos de ETL (procesamiento y carga de datos). En el catálogo de datos de AWS Glue, paga una tarifa mensual simple para almacenar y obtener acceso a los metadatos. El primer millón de objetos que almacene y el primer millón de accesos son gratuitos. Si aprovisiona un punto de conexión de desarrollo para desarrollar interactivamente su código ETL, paga una tarifa por hora, que se factura por segundo.

Trabajos de ETL y puntos de conexión de desarrollo

Solicitudes y almacenamiento en el catálogo de datos

Rastreadores

Ejemplos de precios

¿Está listo para comenzar su proyecto ETL?

Comience con AWS Glue

Con AWS Glue, solo paga el tiempo que el trabajo de ETL demora en ejecutarse. No existen recursos para administrar, costos iniciales y no se le cobra el tiempo de inicio ni de apagado. Se le cobra una tarifa por hora en función de la cantidad de unidades de procesamiento de datos (o DPU) que utilice para ejecutar el trabajo de ETL. Una única unidad de procesamiento de datos (DPU) suministra 4 vCPU y 16 GB de memoria. Un trabajo ETL de Glue requiere un mínimo de 2 DPU. Por defecto, AWS Glue asigna 10 DPU a cada trabajo ETL. Se cobran 0,44 USD por hora de DPU en incrementos de 1 segundo, redondeados al segundo más cercano, con una duración mínima de 10 minutos para cada trabajo de ETL.

Los puntos de conexión de desarrollo son opcionales y la facturación se aplica únicamente si elige desarrollar de manera interactiva el código de ETL. Los puntos de conexión de desarrollo se cobran en función de las horas de unidad de procesamiento de datos que se utilicen durante el tiempo que se aprovisionen los puntos de conexión de desarrollo. Un punto de conexión de desarrollo de Glue requiere un mínimo de 2 DPU. Por defecto, AWS Glue asigna 5 DPU a cada punto de conexión de desarrollo. Se cobran 0,44 USD por hora de DPU en incrementos de 1 segundo, redondeados al segundo más cercano, con una duración mínima de 10 minutos por cada punto de conexión de desarrollo aprovisionado.

Para todas las regiones de AWS en las que AWS Glue se encuentra disponible:

  • 0,44 USD por hora de DPU, facturados por segundo, con un mínimo de 10 minutos por cada trabajo de ETL
  • 0,44 USD por hora de DPU, facturados por segundo, con un mínimo de 10 minutos por cada punto de conexión de desarrollo aprovisionado

Si sus datos de ETL provienen de orígenes de datos como Amazon S3, Amazon RDS o Amazon Redshift, se le cobran tarifas de transferencia de datos y solicitud estándares. Si usa Amazon CloudWatch, se le cobran tarifas estándares para los logs y los eventos de CloudWatch.

Con el catálogo de datos de AWS Glue, puede almacenar hasta un millón de objetos sin cargo. Si almacena más de un millón de objetos, se le cobrará 1 USD cada 100 000 objetos que supere el millón, al mes. Un objeto en el catálogo de datos de AWS Glue es una tabla, una versión de tabla, una partición o una base de datos.

El primer millón de solicitudes de acceso al catálogo de datos de AWS Glue al mes es gratuito. Si excede el millón de solicitudes al mes, se le cobrará 1 USD por millón de solicitudes que supere el primer millón. Algunas de las solicitudes comunes son CreateTable, CreatePartition, GetTable y GetPartitions. Consulte la documentación si desea obtener una lista completa de los tipos de solicitudes que admite el catálogo de datos de AWS Glue.

Para todas las regiones de AWS en las que AWS Glue se encuentra disponible:

Almacenamiento:

  • Gratis para el primer millón de objetos almacenado
  • 1 USD cada 100 000 objetos almacenados que supere el millón, al mes

Solicitudes:

  • Gratis para el primer millón de solicitudes al mes
  • 1 USD por millón de solicitudes que supere el millón, al mes

Se aplica una tarifa por hora por tiempo de ejecución del rastreador de AWS Glue para detectar datos y completar el catálogo de datos de AWS Glue. Se le cobra una tarifa por hora en función de la cantidad de unidades de procesamiento de datos (o DPU) que utilice para ejecutar el rastreador. Una única unidad de procesamiento de datos (DPU) suministra 4 vCPU y 16 GB de memoria. Se cobra en incrementos de 1 segundo, redondeado al segundo más cercano, con una duración mínima de 10 minutos por cada rastreador. El uso de rastreadores de AWS Glue es opcional y puede completar el catálogo de datos directamente a través de la API.

Para todas las regiones de AWS en las que AWS Glue se encuentra disponible:

  • 0,44 USD por hora de DPU, facturados por hora, con un mínimo de 10 minutos por ejecución de rastreador

Ejemplo con trabajo de ETL: Considere un trabajo de ETL que se ejecuta durante 10 minutos y consume 6 DPU. El precio de 1 hora de DPU es 0,44 USD. Como el trabajo se ejecutó durante 1/6 de hora y consumió 6 DPU, se facturarán 6 DPU * 1/6 de hora a 0,44 USD por hora de DPU o 0,44 USD.

Ejemplo con punto de conexión de desarrollo: Imagine que aprovisiona un punto de conexión de desarrollo para conectar su bloc de notas con el fin de que este desarrolle el código de ETL de manera interactiva. Un punto de conexión de desarrollo se aprovisiona con 5 DPU. Si ejecuta el punto de conexión de desarrollo durante 24 minutos o 2/5 partes de una hora, se le facturarán 5 DPU * 2/5 de hora a 0,44 USD por hora de DPU o 0,88 USD.

Ejemplo con la capa gratuita del catálogo de datos de AWS Glue: Consideremos que almacena un millón de tablas en el catálogo de datos de AWS Glue en un determinado mes y que realiza un millón de solicitudes para obtener acceso a dichas tablas. No pagará nada por el uso porque este estará cubierto por la capa gratuita del catálogo de datos de AWS Glue. Puede almacenar el primer millón de objetos y realizar un millón de solicitudes al mes de manera gratuita.

Ejemplo con el catálogo de datos de AWS Glue: Imagine que el uso del almacenamiento continúa siendo igual con un millón de tablas al mes, pero que las solicitudes se duplican a dos millones mensuales. Supongamos que usted también utiliza rastreadores para encontrar tablas nuevas y que estos se ejecutan durante 30 minutos y que consumen 2 DPU.

El costo por almacenamiento continúa siendo 0 USD, ya que el primer millón de tablas es gratuito. El primer millón de solicitudes también es gratuito. Se le cobrará el millón de solicitudes que supera la capa gratuita, cuyo costo sería 1 USD. Los rastreadores se facturan a 0,44 USD por hora de DPU, por lo que pagará 2 DPU * 1/2 hora a 0,44 USD la hora de DPU o 0,44 USD. La factura mensual total sería de 1,44 USD.