发布于: Feb 17, 2021

AWS Glue 现在支持读取存储在 Amazon S3 中的数据,而无需先将其添加到 AWS Glue 数据目录中。此功能可允许您直接使用 Amazon S3 中的位置和对象作为数据源,从而在 AWS Glue Studio 中快速开始进行提取、转换和加载 (ETL) 及 ELT 作业的编写。AWS Glue 可实时推断数据的架构,让您可以在 AWS Glue Studio 可视化作业编写界面中轻松地对其进行转换定义。

以前,您需要先对数据运行 AWS Glue 爬网程序或手动将表添加到数据目录,才能在 AWS Glue Studio 中使用 AWS Glue 数据目录表作为数据源。现在,您只需直接在可视化作业编写界面中指定 Amazon S3 中的某个位置或文件,AWS Glue Studio 即可推断数据的架构并显示出来。在每个作业运行期间,您的作业可以直接从 Amazon S3 存储桶读取数据,并适应架构变化。

AWS Glue Studio 现已在以下亚马逊云科技区域推出:美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(加利福尼亚北部)、美国西部(俄勒冈)、亚太地区(香港)、亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(东京)、加拿大(中部)、欧洲(法兰克福)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(米兰)、欧洲(巴黎)、欧洲(斯德哥尔摩)、中东(巴林)和南美洲(圣保罗)。

要了解有关此功能的更多信息,请访问我们的文档