게시된 날짜: Jan 22, 2019
이제 AWS Glue에서 Python 스크립트를 사용하여 ETL(추출, 변환 및 로드) 워크플로의 일부인 경우가 많은 중소 규모의 일반 작업을 실행할 수 있습니다. 이전에는 AWS Glue 작업이 서버리스 Apache Spark 환경에서 실행되는 작업으로 제한되었습니다. 이제 예를 들어 Python 셸 작업을 사용하여 Amazon Redshift, Amazon Athena 또는 Amazon EMR과 같은 서비스로 SQL 쿼리를 제출하거나 기계 학습 및 과학 분석을 실행할 수 있습니다.
AWS Glue의 Python 셸 작업은 Python 2.7과 호환되는 스크립트를 지원하며, Boto3, NumPy, SciPy, pandas 등과 같은 라이브러리가 사전에 로드되어 제공됩니다. 1개의 DPU(데이터 처리 단위) 또는 0.0625개의 DPU(1/16 DPU에 해당)를 사용하여 Python 셸 작업을 실행할 수 있습니다. 단일 DPU는 4 vCPU의 컴퓨팅과 16GB의 메모리로 구성된 처리 용량을 제공합니다.