AWS Glue 现在支持无服务器流 ETL 作业

发布于: Apr 27, 2020

AWS Glue 现在支持无服务器流 ETL 作业。此功能使您能够轻松设置持续摄取管道，在数秒内节准备好 IoT 事件流、点击流和网络日志等数据，并使其可用于分析。AWS Glue 现在可以使用来自 Amazon Kinesis 和 Apache Kafka 等流数据源的数据，在传输过程中对其进行清理和转换，并将结果持续加载到 Amazon S3 数据湖、数据仓库和其他数据存储中。AWS Glue 流 ETL 作业在 Apache Spark Structured Streaming 引擎上运行，因此，客户可以使用它们来丰富、聚合和组合数据，以及运行各种复杂分析和机器学习操作。

以前，您必须手动构建并整合流处理和监控系统，才能构建流数据摄取管道。AWS Glue 中的流 ETL 作业利用 AWS Glue 的无服务器基础设施来简化资源管理、优化成本并支持您设置持续摄取管道，无需编写代码，从而将实现时间从几个月缩短至几天。

此功能现已在与 AWS Glue 相同的 AWS 区域推出。

要了解有关此功能的更多信息，请访问我们的文档。

AWS Glue 现在支持无服务器流 ETL 作业

终止对 Internet Explorer 的支持