Publicado: Jan 22, 2019
Agora, você pode usar scripts Python no AWS Glue para executar tarefas genéricas de pequeno a médio porte que costumam fazer parte de um fluxo de trabalho de ETL (extrair, transformar e carregar). Antes, as tarefas do AWS Glue eram limitadas às executadas em um ambiente Apache Spark sem servidor. Agora, você pode usar tarefas de shell do Python para, por exemplo, enviar consultas SQL para serviços como Amazon Redshift, Amazon Athena ou Amazon EMR, ou executar machine learning e análises científicas.
As tarefas de shell do Python no AWS Glue oferecem suporte a scripts compatíveis com o Python 2.7 e são pré-carregadas em bibliotecas como Boto3, NumPy, SciPy, pandas e outras. Você pode executar tarefas de shell do Python usando 1 DPU (unidade de processamento de dados) ou 0,0625 DPU (1/16 de uma DPU). Uma única DPU fornece uma capacidade de processamento composta por 4 vCPUs de computação e 16 GB de memória.
Para saber mais sobre a definição de preço das tarefas de shell do Python no AWS Glue, consulte a página de definição de preço. Para saber mais sobre como definir tarefas de shell do Python no AWS Glue, consulte a documentação.
Para ver a disponibilidade do AWS Glue, consulte a tabela de regiões da AWS.