AWS Resilience Hub

アプリケーションを中断に備えて保護する

AWS Resilience Hub の利点

アプリケーションの回復力を継続的に検証および追跡して、停止を減らします
回復目標 (目標復旧時間と目標復旧時点) を評価します。
本番稼働環境で問題が発生する前に、問題を特定して解決します。
復旧コストを削減しながら、ビジネスの継続性を最適化します。

仕組み

AWS Resilience Hub は、AWS 上のアプリケーションの復元体制を管理および改善するための AWS コンソールの中心的な場所です。AWS Resilience Hub では、回復力の目標を定義し、その目標に対する復元体制を評価し、AWS Well-Architected フレームワーク に基づいて改善のための推奨事項を実装できます。AWS Resilience Hub 内では、AWS Fault Injection Service (AWS FIS) の実験を作成して実行することもできます。これは、アプリケーションの実際の障害を模倣して、依存関係をよりよく理解し、潜在的な弱点を明らかにするのに役立ちます。

AWS Resilience Hub は、耐障害性体制を継続的に強化するために必要なサービスとツールを単一の場所で提供します。

特徴

アプリケーションを CloudFormation スタック、Terraform ステートファイル、AppRegistry アプリケーション、リソースグループなどのリソースコレクションとして記述するか、Amazon EKS で管理される Kubernetes ワークロード用のアプリケーション向けに定義します。アプリケーションは、リソースコレクションと Amazon EKS クラスターの両方を使用して記述することもできます。
アプリケーションの回復ポリシーを定義します。これらのポリシーには、アプリケーション、インフラストラクチャ、アベイラビリティーゾーン、およびリージョンの中断に対する RTO および RPO ターゲットが含まれます。

AWS Resilience Hub の評価では、AWS Well-Architected Framework のベストプラクティスを使用して、アプリケーションのコンポーネントを分析し、潜在的な回復力の弱点を明らかにします。これらは、不完全なインフラストラクチャセットアップ、設定ミス、または設定のさらなる改善が必要な状況が原因となって発生する可能性があります。

AWS Resilience Hub は、回復力を改善するための実用的なレコメンデーションを提供します。回復力の評価では、アプリケーションに関する AWS Systems Manager ドキュメントとして復旧手順を作成するのに役立つコードスニペットも生成されます。このドキュメントは、標準作業手順書 (SOP) と呼ばれます。AWS Resilience Hub は、推奨される Amazon CloudWatch モニターとアラームのリストを生成し、デプロイ後に、アプリケーションの回復体制に対する変更をオペレーターがすばやく特定できるようにします。

アプリケーションと SOP が更新されて回復力の評価のレコメンデーションが組み込まれた後、AWS Resilience Hub を使用して、アプリケーションを本番稼働環境にリリースする前に、目標とする回復力をアプリケーションが達成できることをテストおよび検証できます。AWS Resilience Hub は、カオスエンジニアリングサービスである AWS Fault Injection Simulator (FIS) と統合されており、アプリケーションが定義された回復目標内に回復することを検証するために、実際の障害のフォールトインジェクションシミュレーションを提供します。これには、ネットワークエラーや、データベースに対して開かれている接続が多すぎることが含まれる場合があります。AWS Resilience Hub は API も提供するため、回復力の評価とテストを CI/CD パイプラインに統合して、継続的な回復力の検証を実現できます。回復力の検証を CI/CD パイプラインに統合することは、アプリケーションの基盤となるインフラストラクチャに対する変更によって回復力が損なわれないようにするのに役立ちます。

ユースケース

実際の障害のフォールトインジェクションシミュレーションの使用は、復旧に関する標準作業手順書 (SOP) とアラームの有効性を検証するのに役立ちます。

回復力を向上させるための実用的なレコメンデーションを提供し、復旧手順の作成をサポートします。

計画的および計画外の停止におけるイベントの監査証跡を保持します。これは、コンプライアンスおよび規制要件を満たすのに役立ちます。

お客様

Pearson のロゴ

「AWS Resilience Hub を利用すると、アプリケーションの動作を確認して、『これはミッションクリティカルなアプリケーションなのか、それとも少しの間ダウンしても業務に悪影響が生じないものなのか』と自問できます。 値を入力し、Pearson にとって実際にどのアプリケーションが重要であるかをすぐに理解できるため、AWS Resilience Hub はその点で非常に重要でした」


-Pearson、Senior SRE Manager、Infrastructure and Operations、Ronnie Kendrick 氏

Pearson taps AWS Resilience Hub to improve application resilience

「ADL Digital Labs (ADL) は 2017 年に誕生し、現在ではラテンアメリカの金融サービス業界向けのデジタル製品を促進するための最良のプラットフォームの 1 つとなっています。ADL は、お客様に信頼性の高いソリューションを提供することの重要性を認識しており、ポリシーコンプライアンスと可用性に関する目標の可視性を維持しながら、アプリケーションの回復体制を検証および追跡するために、AWS Resilience Hub を組み込んでいます。AWS Resilience Hub を ADL の事業継続フレームワークに統合した結果、コロンビアの主要な 4 つの金融機関の、約 400 万人の顧客にサービスを提供する 8 つの取引チャネルの回復力と事業継続体制が検証されました」- Aval Digital Labs、Head of Architecture、Alexander Chaparro 氏


AWS の詳細を見る