无服务器数据集成 - AWS Glue

AWS Glue

发现、准备和集成所有任意规模的数据

开始使用 AWS Glue

为什么选择 AWS Glue？

准备数据以获得优质结果是分析或人工智能项目的第一步。AWS Glue 是一项无服务器服务，能够让数据集成变得更简单、更快速、更便宜。您可以发现并连接到 100 多个不同的数据来源，在集中式数据目录中管理您的数据，并以可视化方式创建、运行和监控数据管道，进而将数据加载到数据湖、数据仓库和湖仓中。借助内置的生成式人工智能功能，您可以实现 Apache Spark 作业的现代化，并通过 ETL 创作和 Spark 故障排除的智能协助更快地进行开发。

在下一代 Amazon SageMaker 中将您的数据与 AWS Glue 集成

借助下一代 Amazon SageMaker 中的 AWS Glue，您可以通过经济实惠、无服务器和可扩展的数据集成，在一个位置集中管理并构建工作负载。

了解更多

优势

AWS Glue 提供了数据集成所需的全部功能，因此您可以快速获得洞察并将数据投入使用。AWS Glue 提供了一个完全托管的无服务器工具包，用于设计并自动化现代数据管道，包括内置 ETL、架构发现和跨服务集成。

AWS Glue 可自动将甚至于最严苛的资源密集型数据处理作业从 GB 级扩展到 PB 级，无需管理基础设施，您只需为所用资源付费。

AWS Glue 通过提供具有内置调度和监控功能的无服务器数据管道来消除基础设施管理工作，使团队能够专注于构建数据工作流，而不是维护服务器。

在整个数据集成之旅中，从自动生成 ETL 代码到实现 Spark 作业现代化，都可以获得由人工智能提供支持的帮助。AWS Glue 提供了智能代码生成、人工智能辅助的 Spark 升级和内置的 Spark 故障排除。

将您的数据集成到下一代 Amazon SageMaker 中，无论数据位于何处，都可以快速轻松地连接到数据来源。结合使用 AWS Glue、Amazon Athena、Amazon EMR 和 MWAA（全部在 Amazon SageMaker 内部）创建数据处理项目，并从共享的管理和监控体验中受益。Amazon SageMaker 笔记本和 Amazon SageMaker 可视化 ETL 中提供 AWS Glue 数据处理功能。