发布于: Jan 4, 2022

Amazon EMR on EKS 支持自定义图片 - 一种帮助客户自定义 Docker 容器映像的功能,用于在 EMR on EKS 运行 Apache Spark 应用程序。今日,EMR on EKS 开源自定义图像验证工具,允许客户运行一套自动化测试来验证其自定义 docker 容器图像。

通过使用自定义映像,数据工程师和数据科学家可以安装和配置特定于其工作负载的软件包,这些软件包在 EMR 的 Spark 运行时的原定设置分配中不可用,但可以安装到单个不可改变容器中。在自定义图片的支持下,您可以为每个使用案例创建一个包含应用程序及其依赖项的自包含的 Docker 镜像。例如,您可以为数据工程师创建一个自定义映像,其中包含应用程序所需的特定 Java 版本和证书,为数据科学家创建一个单独的自定义映像,其中包含不同的依赖项,如专用库或特定的 Python 依赖项。然后,数据工程师和数据科学家可以在 EMR on EKS 任务中使用其特定于应用程序的自定义映像。

您可以从 GitHub 存储库中下载自定义图像验证工具。有关设置说明和使用示例,请访问我们的入门指南。自定义图像验证工具支持当前可用的 Amazon EMR on EKS。要贡献源代码,请参考贡献指南开发指南。要了解有关 EMR on EKS 中自定义图片的更多内容,请访问文档博客帖子