Amazon Web Services ブログ

VMware Cloud on AWSを利用したディザスタリカバリの設計上の考慮点

AWSでSr. Partner Solutions Architectを務めるSchneider LarbiとPartner Solutions Architectを務めるKiran Reidによる記事です。

VMware Cloud on AWS-dark

VMwareをオンプレミスで実行しているお客様は、AWSグローバルインフラストラクチャを使用することの大きなメリットを理由に、VMware Cloud on AWSをハイブリッドクラウド戦略に組み込んでいます。

組織がハイブリッドクラウド戦略を計画する際、災害時の事業継続性を確保するために、ディザスタリカバリ(DR)は重要な考慮事項です。

この記事では、VMware Cloud on AWSを利用したディザスタリカバリを実装するためのアーキテクチャ上の考慮事項とベストプラクティスについて説明いたします。今回は主にVMware Cloud on AWSとVMware Site Recovery Manager (SRM)アドオンを中心に解説します。

ディザスタリカバリが適切に設計されていない場合、災害が発生した際にサービスが失われ、サービスレベルアグリーメント(SLA)を満たせなくなることがあります。このようなサービスの喪失は、お客様に金銭的な損害や評判の低下をもたらす可能性があります。

ディザスタリカバリのオプション

ディザスタリカバリの意味を理解するために、Gartnerにおける定義を参照してみましょう:

“ディザスタリカバリとは、(1) プライマリチャネルが切断または誤動作した場合に通信チャネルを再確立するための代替ネットワーク回線の使用、および(2) 壊滅的な中断後にデータセンターをフル稼働状態に戻す方法および手順(失われたデータの回復を含む)と定義されます。”

上記の定義を念頭に置いて、お客様が利用できるディザスタリカバリの種類、そしてVMware Cloud on AWSと適用可能なサービスがどのように適合するかについて説明します。

VMware Cloud on AWSでは、複雑さと時間の範囲にわたって4つのレベルのDRサポートを提供しています。以降で4つのエリア(バックアップ & リストア、パイロットライト、AWS内でのウォームスタンバイ、ホットスタンバイ アクティブ/アクティブ)について詳しく説明します。

VMware-Cloud-AWS-DR-Considerations-1

Figure 1 – AWSで実行する場合の4つのDRオプション

バックアップ & リストア

Software Defined Data Center (SDDC)でワークロードの展開を開始する準備が120分以内に整います。これにより、オンデマンドのディザスタリカバリが可能です。リソースをオンデマンドで拡張できる為、アイドル状態のリソースが使用を待機するのを防ぐ費用効果の高いアプローチです。

オンプレミス側でバックアップ構成し、Amazon Simple Storage Service (Amazon S3)をバックアップリポジトリとして設定します。これを有効にするには、VMware Cloud on AWS認定のバックアップが必要です。

バックアップデータは、設定した移動ポリシーに基づいて、S3バケットにオフロードされます。

VMware-Cloud-AWS-DR-Considerations-2

Figure 2 – バックアップ & リストアアーキテクチャを使用したDR

上記のアーキテクチャで実行される事は次のとおりです:

  1. Amazon Route 53は、プライマリデータセンターへのDNSリクエストを処理します。
  2. Backup & Replicationサーバは、ワークロードをバックアップリポジトリにバックアップします。
  3. バックアップリポジトリ上のローカルデータは、AWS Direct Connectまたはインターネットを通じてAmazon S3のキャパシティティアにオフロードされます。
  4. vRAまたはvCLIを使用して、Webポータルのオートメーションスクリプトを使用して、リカバリプロセスは、指定したAWSのリカバリリージョンでVMware SDDCクラスタを起動及び構成します。
  5. 新しく作成されたSDDC内に新しいバックアップリポジトリインスタンスをデプロイ及び構成。
  6. S3に保存されている以前のデータが検出されます。初期メタデータとアーカイブインデックスの同期が実行されます。
  7. SDDCクラスタにワークロードが復元され、サービスがオンラインに戻ります。
  8. Amazon Route 53のレコードを更新し、クラウド上の新しいセカンダリデータセンターへリクエストを処理します。

パイロットライト

パイロットライト ソリューションを使用して、オンプレミスの本番環境のリカバリサイトとしてVMware Cloud on AWSをリカバリサイトとして保護します。VMware Cloud on AWSでは、2ノードのパイロットライト環境から始めることができます。パイロットライト環境では、Tier-0アプリケーションだけでなく、セカンダリドメインコントローラなどの重要なユーティリティ仮想マシン(VM)を常時稼働させることができます。

その後、災害発生時にオンデマンドでスケールアップできます。このアプローチを使用すると、災害発生時により多くのノードにスケールアップし、サポートされるバックアップソリューションを活用してワークロードをリカバリする必要があるまで、お客様は2ノードの料金を支払います。

ベストプラクティスとして、この方法を使用する場合、SDDCクラスタ内のホストを自動的にスケーリングするスクリプトをリカバリプランに追加する必要があります。

もう1つのオプションは、パイロットライトアーキテクチャを実装するための手頃な方法を提供する新しいVMware Cloud Disaster Recovery (VCDR)を活用することです。VCDRを使用すると、VCDRがSDDCを自動的に展開するし、VMを新しいSDDCにリカバリする為、災害が発生するまでVMware SDDCを運用する必要はありません。

さらに、VCDRを使用すると、SDDCホストの小さなサブネットを事前に展開して、純粋なオンデマンドアプローチよりも低い目標復旧時間(RTO)要件で重要なアプリケーションをリカバリできます。

このモデルは、SDDCのセットアップに約2時間かかる可能性があるため、RPO(目標復旧時点)とRTOが低いお客様に適しています。また、リカバリが必要な仮想マシンの数やサイズによっては、仮想マシンのリストアに時間がかかる場合があります。

AWS内でのウォームスタンバイ

次のオプションは、ウォームスタンバイのアプローチです。リカバリサイトでTier1またはビジネスクリティカルなサービスをリカバリするためのリソース数を予めプロビジョニングしておき、重要度の低い、RTOの長いサービスについては、Elastic Distributed Resource Schedulerを使用してスケールアップ後、バックアップからリカバリを行います。

このソリューションを使用する利点は、お客様が重要なビジネスアプリケーションを保護しながら、コスト削減を実現できることです。必要なときにすべてのDRリソースに費用を支払います。また、業務に影響を与えることなく、アプリケーションに対するDRテストを無停止で実行できます。

前述のように、お客様は災害発生時またはDRテスト中に、スケールアップを行い、バックアップからVMをリストアして、リカバリ要件を満たすことができます。VMware Cloud on AWSではVMware SRMを利用する事によりこのDRオプションを実現する事ができます。

ホットスタンバイ アクティブ/アクティブ

アクティブ/アクティブのデプロイメントは、お客様が完全な本番環境を運用するために必要なすべてのリソースを展開することを選択した場合に使用されます。これは、アクティブ/アクティブのデータセンターを稼働し、RTOとRPOを低くしたいお客様に役立ちます。

災害発生時には、ビジネスの即時のニーズを満たすためのインフラストラクチャの変更が、ほとんど、またはまったく必要ありません。このDRオプションをサポートする為にオンプレミスとVMware Cloud on AWS間でVMware SRMを構成する事ができます。

ディザスタリカバリのアーキテクチャオプション

ディザスタリカバリは、VMware Site Recovery ManagerをDRソフトウェアとして使用し、リカバリサイトとしてVMware Cloud on AWSを使用する事により実現できます。

組織によっては、従来のDRのコストと複雑さに悩まされており、リカバリソリューションを導入されておりません。これらの組織は、Site RecoveryとVMware Cloud on AWSを使用して、コスト効率の高い方法でDRを実装できるようになります。

VMware Cloud on AWSでVMware Site Recovery Managerを実装するためにサポートされているデザインパターンのいくつか以下に示します。

オンプレミスからVMware Cloud on AWSへの新しいDRの確立

VMware Cloud on AWSとVMware Site Recovery Managerを利用する事により、組織はディザスタリカバリを実装するために同等のITインフラストラクチャを用意する必要がなくなります。

さらに、コロケーションデータセンターを購入またはレンタルする必要はありません。代わりに、VMware Cloud on AWSをリカバリサイトとして使用し、オンデマンドで、またはAWSクラウド上で最小のvSphereクラスタの予約からリソースを消費することができます。

VMware-Cloud-AWS-DR-Considerations-3

Figure 3 – VMware Cloud on AWSを新しいDRターゲットとして使用する

このアーキテクチャでは、VMware Site Recovery ManagerがVMware Cloud on AWSで有効になり、コンポーネントがオンプレミスでデプロイされ、VMware Cloud on AWS SDDCとペアになります。

これにより、VMをパブリックインターネット経由でVMware Cloud on AWSに複製できます。仮想マシンレプリケーションの為にAWS Direct Connectまたは仮想プライベートネットワーク(VPN)を使用してVMware Cloud on AWSに接続することもサポートされています。

既存のDRサイトをVMware Cloud on AWSに置き換える

既存のDRデータセンターを持ち、キャパシティに余裕がなく、ビジネスニーズを迅速かつコスト効率よく促進するために必要なハードウェアまたはデータセンタースペースを調達できなくなった組織は、VMware Cloud on AWSを新しいDRワークロードのリカバリターゲットとして使用できます。

以下のデプロイメントデザインに示すように、お客様はリカバリサイトとして、オンプレミスにあるコロケーションデータセンターをVMware Cloud on AWSに置き換えることができます。

VMware-Cloud-AWS-DR-Considerations-4

Figure 4 – VMware Cloud on AWSをオンプレミスのDRサイトと置き換える

VMware Cloud on AWSで既存のDRソリューションを補完

VMware Site Recovery Managerを利用する事により、以下のFigure 5に示すように、マルチリカバリサイトアーキテクチャを構成できます。このアーキテクチャでは、お客様は既存のDR実装をVMware Cloud on AWSおよびVMware Site Recovery Managerで補完できます。

VMware-Cloud-AWS-DR-Considerations-5

Figure 5 – VMware Cloud on AWSで既存のDRサイトを補完する

VMware Cloud on AWSのディザスタリカバリ

最後に、VMware Cloud on AWSで既にワークロードを実行している組織は、利用しているリージョンの1つで停止が発生した場合に備えて、Site Recovery Managerを使用してリージョン間のDR保護を行うことができます。

VMware-Cloud-AWS-DR-Considerations-6

Figure 6 – VMware Cloud on AWSの保護の為にリージョン間またはオンプレミスでDRサイトを構成する

このアーキテクチャでは、Site Recovery Managerは、クラウド上のワークロードのリカバリサイトとして、別のリージョンのVMware Cloud on AWSまたはオンプレミスを使用いたします。

設計上の考慮点

真に機能するディザスタリカバリソリューションを正常に実装するには、DRインフラストラクチャをサポートする基盤となるインフラストラクチャネットワークを適切に設計する必要があります。

リカバリサイトに新しいネットワークを作成して、ネットワークインフラストラクチャを簡素化することがベストプラクティスです。Site Recovery Managerには、リカバリサイト(VMware Cloud on AWSまたはオンプレミス)で復旧されたすべての仮想マシンのIPアドレスを再設定する機能を備えています。

この機能はVMware Toolsに依存しているため、フェイルオーバーが必要な重要な仮想マシンにVMware Toolsがインストールされていることを確認する必要があります。

VMware HCXを使用してオンプレミスネットワークをVMware Cloud on AWSに拡張し、これらのネットワークをリカバリネットワークとして使用しているお客様もいます。ディザスタリカバリのイベントまたはテストでは、オンプレミスのデータセンターからゲートウェイを移動するために、手動による介入が必要になることにご注意ください。また、ネットワークの拡張に使用されているアプライアンスの単一障害点にも注意する必要があります。

さらに、DNSによる名前解決は、すべてのサービスが稼働していることを確認するために重要です。ベストプラクティスとして、フェイルオーバーとDNSによる名前解決を可能にするために、DNSインフラストラクチャをリカバリサイトに拡張したことを確認してください。Amazon Route 53は、このシナリオで使用する優れたDNSサービスであり、災害時にオンプレミスのDNSインフラストラクチャがアクティブでなくなった場合に自動的にフェイルオーバーする機能を備えています。

VMware-Cloud-AWS-DR-Considerations-7

Figure 7 – DRのためのVMware Cloud on AWSとAmazon Route 53利用の汎用アーキテクチャ

Amazon Route 53のフェイルオーバールーティングポリシーを使用すると、DNSをクラウド内のVMware Cloud on AWSクラスタに自動的にフェイルオーバーして、災害時にDNS解決を継続できるようにすることができます。

ディザスタリカバリのベストプラクティス

VMware Cloud on AWSを使用してディザスタリカバリプランをサポートする場合、正常に機能するプランを確保するために留意すべき事項がいくつかあります。

  • 文書化されたディザスタリカバリ計画を作成する: 詳細なリカバリプランがないと、ITインフラストラクチャとビジネスクリティカルなアプリケーションをリカバリする方法を考える時間がほとんどないか、まったくないことがよくあります。災害発生後にシステムをオンラインに戻すために、DRに関する文書化された計画があることを確認してください。
    .
    システムが停止した場合に、許可されたスタッフがリカバリプランにアクセスできるようにするプロセスと手順が整っていることを確認します。このようなドキュメントは、Amazon S3などのクラウドベースのストレージ、またはその他のクラウドストレージサービスに、オフサイトで保存できます。
    .
  • リカバリサイトのロケーション: DR計画用に選択したリカバリサイトは、同じ場所または爆風半径にある二次的な建物であってはなりません。ベストプラクティスとして、オンプレミスの ITインフラストラクチャのリカバリサイトは、プライマリサイトに影響するディザスタの影響を受けにくいエリアに存在する必要があります。サイト間の数マイルの距離では、本当に安全なリカバリサイトとしては不十分な場合があります。
    .
    お客様は、DRの場所がビジネス要件および規制要件を満たしていることを確認する必要があります。一部の地域では、気象パターンやユーティリティプロバイダに考慮する必要があります。VMware Cloud on AWSをリカバリサイトとして使用する場合は、オンプレミスのデータセンターと同じリージョンに配置しないことをお勧めします。.
    たとえば、オンプレミス環境が米国の東海岸にある場合、ITインフラストラクチャのリカバリサイトとして、中央または西海岸地域のVMware Cloud on AWSを選択できます。
    .
  • リカバリプランを頻繁にテストする: 多くの組織ではDR計画がありますが、テストが不足しているため、実際の災害ではリカバリプロセスが困難な場合がよくあります。ITチームがフェイルオーバーとフェイルバックのプロセスに精通して機能を確認できるようにする為に、リカバリプランを定期的にテストすることをお勧めします。
    .
    VMwareが提供するSite Recovery ManagerサービスのアドオンをVMware Cloud on AWSで使用すると、お客様はこれらのテストを定期的に実行し、VMware Cloud on AWSへの実際のリカバリがどのように行われるかをシミュレートできます。
    .
  • オペレーションの再開の計画: 災害またはテストの後にVMとアプリケーションがリカバリサイトから実行されるまで、システムリカバリは完全には完了しません。アプリケーションは、災害発生前と同じ動作状態である必要があります。このプロセスも困難な場合があるため、リカバリサイトでアプリケーションを動作させるのに必要な手順とテストの計画を文書化することをお勧めします。
    .
    Site Recovery ManagerとVMware Cloud on AWSをリカバリサイトとして使用する場合、VMware Cloud on AWSにフェイルオーバーされた仮想マシンの起動順序を定義することで、これらのプロセスの一部を自動化できます。
    .
  • 変更管理プロセスにDRを含める: 多くの場合、ITインフラストラクチャ環境に実装される複数の変更があります。このため、ハードウェア、ソフトウェア、ネットワークの変更など、環境に変更がある場合は常にDRプランを更新する必要があります。これにより、リカバリプランが完全に機能することが保証されます。

結論

災害復旧のターゲットとして機能させるために別のオンプレミスサイトを維持することは、労力を要し、展開と維持に多大な投資を必要とします。多くのお客様は、DRソリューションの実装の重要性を認識しており、パブリッククラウドの活用を検討しています。

VMware Site Recovery Managerは、VMware Cloud on AWSを補完し、クラウドベースのDRに関連する多くの課題をお客様が克服できるよう支援します。Site Recoveryが組織にどのように役立つか知りたい場合は、以下のリソースを参照してください。

AWSリソース:

VMware Resources:

翻訳はPartner SA 豊田が担当しました。原文はこちらです。