Publié le: May 19, 2022
Incident Manager, une fonctionnalité de AWS Systems Manager, annonce une prise en charge étendue de l'automatisation des runbooks pour accélérer le diagnostic et la résolution des incidents. AWS Systems Manager est la plateforme opérationnelle de vos applications et ressources AWS. Elle vous aide à automatiser les processus réactifs pour diagnostiquer et corriger rapidement les problèmes opérationnels. Les clients peuvent désormais créer des runbooks d'incidents qui exécutent automatiquement des actions de remédiation sur les ressources concernées, comme l'activation de la mise à l'échelle automatique d'une table DynamoDB qui approche de sa capacité avant d'engager l'ingénieur d'astreinte. Les clients peuvent également invoquer des runbooks supplémentaires directement depuis la console Incident Manager pour aider à résoudre l'incident plus rapidement.
Lorsqu'un incident est ouvert, Incident Manager peut désormais renseigner les valeurs des paramètres du runbook, comme l'ID de l'incident ou les ressources AWS spécifiées dans les alarmes CloudWatch et les événements EventBridge. Cela permet aux clients d'automatiser des diagnostics supplémentaires ou des actions d'atténuation à partir de leurs documents AWS Systems Manager Automation. La console Incident Manager suit la progression du runbook et les exécutions supplémentaires du runbook pour vous aider à organiser votre réponse.
Pour démarrer, sélectionnez Incident Manager dans la console de gestion AWS ou naviguez vers AWS Systems Manager. Pour en savoir plus sur l'automatisation des runbooks dans Incident Manager, lisez notre documentation ou suivez le tutoriel.