为什么选择 AWS Glue?
准备数据以获得优质结果是分析或人工智能项目的第一步。AWS Glue 是一项无服务器服务,可让数据集成更简单、更快、更便宜。您可以发现并连接到 100 多个不同的数据来源,在集中式数据目录中管理您的数据,并以可视化方式创建、运行和监控数据管道,进而将数据加载到数据湖、数据仓库和湖仓中。借助内置的生成式人工智能功能,您可以实现 Apache Spark 作业的现代化,并通过 ETL 创作和 Spark 故障排除的智能协助更快地进行开发。
在下一代 Amazon SageMaker 中将您的数据与 AWS Glue 集成
借助下一代 Amazon SageMaker 中的 AWS Glue,您可以通过经济实惠、无服务器和可扩展的数据集成,在一个位置集中管理并构建工作负载。
优势
-
AWS Glue 提供了数据集成所需的全部功能,因此您可以快速获得洞察并将数据投入使用。AWS Glue 提供了一个完全托管的无服务器工具包,用于设计并自动化现代数据管道,包括内置 ETL、架构发现和跨服务集成。
AWS Glue 可自动将甚至于最严苛的资源密集型数据处理作业从 GB 级扩展到 PB 级,无需管理基础设施,您只需为所用资源付费。
-
AWS Glue 通过提供具有内置调度和监控功能的无服务器数据管道来消除基础设施管理工作,使团队能够专注于构建数据工作流,而不是维护服务器。
-
在整个数据集成之旅中,从自动生成 ETL 代码到实现 Spark 作业现代化,都可以获得由人工智能提供支持的帮助。AWS Glue 提供了智能代码生成、人工智能辅助的 Spark 升级和内置的 Spark 故障排除。
-
将您的数据集成到下一代 Amazon SageMaker 中,无论数据位于何处,都可以快速轻松地连接到数据来源。结合使用 AWS Glue、Amazon Athena、Amazon EMR 和 MWAA(全部在 Amazon SageMaker 内部)创建数据处理项目,并从共享的管理和监控体验中受益。Amazon SageMaker 笔记本和 Amazon SageMaker 可视化 ETL 中提供 AWS Glue 数据处理功能。
应用场景
简化 ETL 管道管理
借助自动预置和工作线程管理,消除管理基础设施工作,并且可将所有数据集成需求合并到单一服务中。
交互式探索、处理数据以及对其进行实验
借助 AWS Glue 交互式会话,数据工程师可以使用其选择的集成式开发环境(IDE)或笔记本,以交互方式探索和准备数据。
高效发现数据
快速识别 AWS、本地和其他云端的数据,然后立即将其用于查询和转换。
支持各种处理框架和工作负载
更轻松地支持各种数据处理框架,例如 ETL 和 ELT,同时支持各类工作负载,包括批处理、微批处理和流式传输。
新增内容
正在加载
正在加载
正在加载
正在加载
正在加载
找到今天要查找的内容了吗?
请提供您的意见,以便我们改进网页内容的质量