게시된 날짜: Nov 28, 2022
AWS Glue for Ray는 AWS Glue의 새로운 엔진 옵션입니다. 데이터 엔지니어는 Python 및 주요 Python 라이브러리를 사용하여 대규모 데이터 세트를 처리하는 데 AWS Glue for Ray를 사용할 수 있습니다. AWS Glue는 여러 소스에서 데이터를 쉽게 탐색, 준비, 이동 및 통합하는 데 사용되는 확장형 서버리스 데이터 통합 서비스입니다. AWS Glue for Ray는 Python 워크로드를 확장할 수 있는 새로운 주요 오픈 소스 컴퓨팅 프레임워크인 Ray(ray.io)와 데이터 통합을 위한 서버리스 옵션을 결합합니다.
코드를 실행할 때 사용하는 리소스에 대한 비용만 지불하면 되며, 어떤 리소스도 구성하거나 튜닝할 필요가 없습니다. AWS Glue for Ray는 다중 노드 클러스터를 통해 Python 코드의 분산 처리를 원활하게 합니다. AWS Glue ETL(추출, 변환 및 로드) 작업을 실행할 수 있는 어디서든 Ray의 작업을 생성 및 실행할 수 있습니다. 이는 기존 AWS Glue 작업, 명령줄 인터페이스(CLI) 및 API를 포함합니다. AWS Glue Studio, Amazon SageMaker Studio 노트북 또는 로컬에서 노트북을 통해 Ray 엔진을 선택할 수 있습니다. Ray의 작업이 준비되면 온디맨드로 실행하거나 일정에 따라 실행할 수 있습니다.
AWS Glue for Ray(평가판)는 미국 동부(오하이오), 미국 동부(버지니아 북부), 미국 서부(오레곤), 아시아 태평양(도쿄), 유럽(아일랜드) AWS 리전에서 사용할 수 있습니다.
자세히 알아보려면 설명서를 참조하세요.