为什么选择 AWS Glue?

准备数据以获得优质结果是分析或人工智能项目的第一步。AWS Glue 是一项无服务器服务,可让数据集成更简单、更快、更便宜。您可以发现并连接到 100 多个不同的数据来源,在集中式数据目录中管理您的数据,并以可视化方式创建、运行和监控数据管道,进而将数据加载到数据湖、数据仓库和湖仓中。借助内置的生成式人工智能功能,您可以实现 Apache Spark 作业的现代化,并通过 ETL 创作和 Spark 故障排除的智能协助更快地进行开发。

在下一代 Amazon SageMaker 中将您的数据与 AWS Glue 集成

借助下一代 Amazon SageMaker 中的 AWS Glue,您可以通过经济实惠、无服务器和可扩展的数据集成,在一个位置管理并构建工作负载。

图片

优势

使用案例

高效发现数据

快速识别 AWS、本地和其他云端的数据,然后立即将其用于查询和转换。

交互式探索、处理数据以及对其进行实验

借助 AWS Glue 交互式会话,数据工程师可以使用其选择的集成开发环境 (IDE) 或笔记本,以交互方式探索和准备数据。

简化 ETL 管道管理

借助自动预置和工作线程管理,不再需要管理基础设施,并且可将所有数据集成需求合并到单一服务中。

支持各种处理框架和工作负载

更轻松地支持各种数据处理框架,例如 ETL 和 ELT,同时支持各类工作负载,包括批处理、微批处理和流式处理。

深入了解 AWS