发布于: Jun 5, 2023

AWS Glue for Ray 是 AWS Glue 上的一个数据集成引擎选项,现已全面推出。AWS Glue for Ray 可帮助数据工程师和 ETL(提取、转换、加载)开发人员扩展他们的 Python 任务。AWS Glue 是一项无服务器、可扩展的数据集成服务,用于发现、准备、移动和集成来自多个源的数据。AWS Glue for Ray 将用于数据集成的无服务器功能与 Ray (ray.io) 相结合,Ray (ray.io) 是一个热门的新开源计算框架,可帮助您扩展 Python 工作负载。

与 AWS Glue 上的 Apache Spark 和 Python 引擎类似,您只需为运行代码时使用的资源付费,不需要配置或调整资源。AWS Glue for Ray 促进了多节点集群上 Python 代码的分布式处理。您可以在任何可以运行 AWS Glue ETL 作业的地方创建和运行 Ray 作业。这包括现有的 AWS Glue 作业、命令行界面 (CLI) 和 API。您可以在本地选择 AWS Glue for Ray 引擎,也可以通过 AWS Glue Studio 和 Amazon SageMaker 工作室笔记本电脑上的笔记本进行选择。Ray 作业就绪后,您可以按需或按计划运行它。

AWS Glue for Ray 在以下 AWS 区域全面推出:美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(东京)和欧洲地区(爱尔兰)。

要了解更多信息,请访问 AWS Glue 数据集成引擎,或者阅读 AWS Glue 开发人员指南:AWS Glue for Ray