게시된 날짜: Nov 8, 2021

이제 Amazon CloudWatch 경보의 상태를 확인하고 AWS Systems Manager(SSM) 자동화를 실행하는 AWS Fault Injection Simulator(FIS) 실험을 생성하고 실행할 수 있습니다. 이제 사전 구성된 SSM Agent 문서를 사용하여 Amazon EC2 인스턴스에 I/O, 네트워크 블랙홀 및 패킷 손실 결함을 주입하는 새로운 FIS 실험 작업을 실행할 수도 있습니다. 테스트 환경이든 프로덕션 환경이든 실제 조건에서 애플리케이션이 스트레스에 어떻게 반응할지 예측하기 어려울 수 있으므로 FIS 실험에 경보 확인 및 자동화된 런북을 통합하면 네트워크 문제, 인스턴스 종료, API 제한 또는 기타 실패 조건과 같은 중단 이벤트를 주입할 때 더 많은 확신을 얻는 데 도움이 될 수 있습니다.

첫째, 새로운 CloudWatch 작업을 사용하면 FIS 실험 워크플로의 일부로 CloudWatch 경보의 상태를 확인할 수 있습니다. 그런 다음 실험이 실행되면 알람이 예상 상태인 OK, ALARM 또는 INSUFFICIENT_DATA인지 확인합니다. 예를 들어 이를 사용하여 실험의 다음 작업(예: EC2 인스턴스 재부팅)으로 이동하기 전에 이전 작업(예: 네트워크 대기 시간 주입)의 영향이 적용되었는지 여부를 확인할 수 있습니다.

이제 FIS 실험 내에서 AWS Systems Manager Automation 런북을 실행할 수 있습니다. AWS Systems Manager Automation을 사용하면 EC2 AMI 또는 CloudFormation 템플릿 생성 및 삭제, S3 버킷 삭제, AWS Step Function 상태 머신 실행, AWS Lambda 함수 호출, 태그 생성, EC2 인스턴스 시작 또는 AWS API 요청과 같은 다양한 일반적인 작업을 수행하는 자동화를 구축하고 실행할 수 있습니다. FIS 실험 내에서 트리거되도록 Automation 런북을 구성하면 실제 조건과 더 유사한 복잡한 실패 조건을 보다 쉽고, 안전하고, 반복적으로 재현할 수 있습니다.

마지막으로 다음을 포함하여 오류 주입 작업으로 실행하기 위한 몇 가지 신규 및 업데이트된 SSM Agent 문서를 이제 사용할 수 있습니다. IOS 스트레스 작업, 주어진 프로토콜 및 포트에 대한 인바운드 또는 아웃바운드 트래픽을 삭제하는 네트워크 블랙홀 작업; 주어진 네트워크 인터페이스를 통해 IP 주소/블록, 도메인 또는 S3 및 DynamoDB를 포함한 AWS 서비스와 같이 지정한 소스로/에서 대기 시간 및/또는 지터를 추가하는 네트워크 대기 시간 작업 그리고 패킷 손실 실패를 주어진 인터페이스와 (선택적으로) 소스에 주입할 수 있는 두 개의 네트워크 패킷 손실 작업. 이러한 SSM 문서는 Amazon Linux 및 Ubuntu를 실행하는 EC2 인스턴스용으로 사전 구성되어 있습니다.

AWS 관리 콘솔에서 또는 AWS SDK를 사용하여 결함 주입 실험 생성 및 실행을 시작할 수 있으며 이러한 각각의 새로운 기능은 오늘부터 사용할 수 있습니다. AWS FIS는 모든 상용 AWS 리전에서 사용할 수 있습니다.