Amazon Athena for Apache Spark 现已在 Amazon SageMaker Notebook 中推出
Amazon SageMaker 现在支持 Amazon Athena for Apache Spark,将全新的 Notebook 体验和快速的无服务器 Spark 体验融合在一个统一的工作环境中。现在,数据工程师、分析师和数据科学家无需管理基础设施,即可在一个平台上轻松地查询数据、运行 Python 代码、开发作业、训练模型、直观展示数据并与人工智能进行交互,并且可以采用按秒付费模式。
Athena for Apache Spark 可在几秒内完成扩展,以支持从交互式查询到 PB 级作业的各种工作负载。现在,Athena for Apache Spark 在 Spark 3.5.6 上运行,这是 AWS 上使用的高性能 Spark 引擎,针对包括 Apache Iceberg 和 Delta Lake 在内的开放表格式进行了优化。它还提供全新的调试功能、Spark 用户界面中的实时监控,并且支持通过 Spark Connect 进行安全的交互式集群通信。当您使用这些功能处理数据时,Athena for Spark 现在会强制执行在 AWS Lake Formation 中定义的表级访问控制。
在支持 Amazon SageMaker 融通式合作开发工作室的所有区域,Athena for Apache Spark 现已在 Amazon SageMaker Notebook 中推出。要了解更多信息,请参阅 Apache Spark 引擎版本 3.5、AWS 新闻博客或 Amazon SageMaker 文档。 请访问入门指南,通过 Amazon SageMaker Notebook 来试用这项功能。