メリット
仕組み
AWS Resilience Hub は、AWS 上のアプリケーションの復元体制を管理および改善するための AWS コンソールの中心的な場所です。AWS Resilience Hub では、回復力の目標を定義し、その目標に対する回復体制を評価して、AWS Well-Architected フレームワーク に基づいて改善のためのレコメンデーションを実装できます。AWS Resilience Hub 内では、AWS Fault Injection Service (AWS FIS) の実験を作成して実行することもできます。これは、アプリケーションの実際の障害を模倣するため、依存関係をより良く理解し、潜在的な弱点を明らかにするのに役立ちます。
AWS Resilience Hub は、単一の場所で、回復体制を継続的に強化するために必要なサービスとツールを提供します。
特徴
アプリケーションを CloudFormation スタック、Terraform ステートファイル、myApplications、リソースグループなどのリソースコレクションとして記述するか、Amazon EKS で管理される Kubernetes ワークロード用のアプリケーション向けに定義します。アプリケーションは、リソースコレクションと Amazon EKS クラスターの両方を使用して記述することもできます。
AWS Resilience Hub の評価では、AWS Well-Architected フレームワークのベストプラクティスを使用して、アプリケーションのコンポーネントを分析し、潜在的な回復力の弱点を明らかにします。これらは、不完全なインフラストラクチャセットアップ、設定ミス、または設定のさらなる改善が必要な状況が原因となって発生する可能性があります。
AWS Resilience Hub は、回復力を改善するための実用的なレコメンデーションを提供します。回復力の評価では、アプリケーションに関する AWS Systems Manager ドキュメントとして復旧手順を作成するのに役立つコードスニペットも生成されます。このドキュメントは、標準作業手順書 (SOP) と呼ばれます。AWS Resilience Hub は、推奨される Amazon CloudWatch モニターとアラームのリストを生成し、デプロイ後に、アプリケーションの回復体制に対する変更をオペレーターがすばやく特定できるようにします。
アプリケーションと SOP が更新されて回復力の評価のレコメンデーションが組み込まれた後、AWS Resilience Hub を使用して、アプリケーションを本番稼働環境にリリースする前に、目標とする回復力をアプリケーションが達成できることをテストおよび検証できます。AWS Resilience Hub は、カオスエンジニアリングサービスである AWS Fault Injection Simulator (FIS) と統合されており、アプリケーションが定義された回復目標内に回復することを検証するために、実際の障害のフォールトインジェクションシミュレーションを提供します。これには、ネットワークエラーや、データベースに対して開かれている接続が多すぎることが含まれる場合があります。AWS Resilience Hub は API も提供するため、回復力の評価とテストを CI/CD パイプラインに統合して、継続的な回復力の検証を実現できます。回復力の検証を CI/CD パイプラインに統合することは、アプリケーションの基盤となるインフラストラクチャに対する変更によって回復力が損なわれないようにするのに役立ちます。
ユースケース
実際の障害のフォールトインジェクションシミュレーションの使用は、復旧に関する標準作業手順書 (SOP) とアラームの有効性を検証するのに役立ちます。
回復力を向上させるための実用的なレコメンデーションを提供し、復旧手順の作成をサポートします。
計画的および計画外の停止におけるイベントの監査証跡を保持します。これは、コンプライアンスおよび規制要件を満たすのに役立ちます。
Ikano Bank
「Ikano Bank では、クラウドのメリット、特にディザスタリカバリ機能を十分に実現したいと考えていましたが、それを実現するための社内の機能はありませんでした。AWS Resilience Hub は、AWS Well-Architected フレームワークに基づいてカスタマイズされた推奨事項を提供し、当社の実装が運用上の優秀性と信頼性に関するベストプラクティスに沿ったものであるようにしました。これにより、金融機関として、当社のシステムに回復力が組み込まれているという安心感が得られました」
Ikano Bank、Head of IT Operations and Services、Carl Lundquist 氏
Pearson
Pearson はアプリケーションの回復力を高めるために AWS Resilience Hub を活用しています。動画をご視聴ください。
「AWS Resilience Hub を利用すると、アプリケーションの動作を確認して、『これはミッションクリティカルなアプリケーションなのか、それとも少しの間ダウンしても業務に悪影響が生じないものなのか』と自問できます。 値を入力し、Pearson にとって実際にどのアプリケーションが重要であるかをすぐに理解できるため、AWS Resilience Hub はその点で非常に重要でした」
Pearson、Infrastructure and Operations、Senior SRE Manager、Ronnie Kendrick 氏
Aval Digital Labs
「ADL Digital Labs (ADL) は 2017 年に誕生し、現在ではラテンアメリカの金融サービス業界向けのデジタル製品を促進するための最良のプラットフォームの 1 つとなっています。ADL は、お客様に信頼性の高いソリューションを提供することの重要性を認識しており、ポリシーコンプライアンスと可用性に関する目標の可視性を維持しながら、アプリケーションの回復体制を検証および追跡するために、AWS Resilience Hub を組み込んでいます。AWS Resilience Hub を ADL の事業継続フレームワークに統合した結果、コロンビアの主要な金融機関の 4 つで、約 400 万人の顧客にサービスを提供する 8 つの取引チャネルの回復力と事業継続体制が検証されました」
Aval Digital Labs、Head of Architecture、Alexander Chaparro 氏