发布于: Oct 20, 2020

AWS Batch 现在允许用户根据定义的退出代码配置重试策略。客户现在可以根据特定的事件(例如基础设施故障或应用程序故障)来确定其 AWS Batch 作业是否应该重试。这让客户能够严格控制作业失败时的操作 – 通过仅在必要时重试,从而降低成本并提高吞吐速度。

批处理作业可能需要重试的原因很多,例如应用程序消耗的实例内存过多,或者作业不能访问成功执行其代码所需的特定文件。不论失败的原因是什么,允许重试往往已经成为一个基本要求,尤其是对于希望使用可中断的 Spot 实例来节省成本的客户。 

从今天开始,AWS Batch 将允许用户根据多种故障代码指定作业是否应该重试。这有利于客户设置简单的重试策略,例如在作业因 Spot 收回实例而失败时,作业会重试。如果作业失败的原因是其消耗的内存过多,则不会重试,作业将会失败,并且会通知用户。 

要了解更多有关如何在 AWS Batch 中配置重试策略的信息,请参阅我们的文档