发布于: Feb 23, 2022
AWS Glue 现提供任务运行洞察功能,其可帮助确定错误源和性能瓶颈,从而减少 Apache Spark 任务开发时间。AWS Glue 是一项数据集成服务,可帮助客户使用无服务器 Apache Spark 和 Python 来发现、准备并结合数据以用于分析。Spark 的分布式处理和“延迟执行”模式不仅使数据工程师难以诊断错误并调节性能,而且也导致这些工作十分耗时。此次发布后,AWS Glue 可为您提供 Spark 任务的自动化分析和错误解释,从而实现更快流程。
任务运行洞察可简化任务运行故障时的根本原因分析,缓和 AWS Glue 和 Apache Spark 的学习曲线。其可确定故障所在的代码行编号,并提供有关详细信息,以了解 AWS Glue 引擎在错误发生时的操作。它还能向您解释错误,并提供有关如何调节任务和代码的建议,以修复问题并提升性能。此功能增强了 AWS Glue 先前提供的 Spark UI Logs 及 CloudWatch Logs and Metrics 功能。
此功能在已推出 AWS Glue 的所有 AWS 区域开放。
如需了解详情,请参阅我们的文档,或在 AWS Glue Studio 的任务监控控制面板中查看任务运行。