Amazon Web Services ブログ

AWS DataSync を使用して Amazon FSx for Windows File Server に移行する

多くのお客様は、Windows ワークロード用のオンプレミスのファイルストレージインフラストラクチャを所有しており、継続的な維持から開放されることを希望しています。お客様が合理的に避けたいと考えるハードウェアとソフトウェアのバックアップ、パッチ適用、監視、および維持に付随する課題があります。すなわち、コストと時間の浪費です。これまでにお客様から、AWS に対して、ネイティブ Windows ファイルサーバー機能を引き続き提供しつつ、基盤インフラストラクチャについての心配から解放してくれる完全マネージド型のネイティブ Windows ファイルサーバーソリューションの提供のご依頼がありました。このご依頼への対応として、AWS は、Amazon FSx for Windows File Server (Amazon FSx) を生み出しました。これは、完全マネージド型の SMB ベースのファイルストレージを Windows アプリケーションおよびワークロード用に提供するものです。AWS は、Amazon FSx を使用して、基盤となるハードウェア、ソフトウェア、およびオペレーション (サーバー、ストレージ、パッチ適用、可用性、耐久性、暗号化、監視、バックアップなどを含む) を管理します。

次のお客様からの質問は、「当社のオンプレミスシステムから Amazon FSx for Windows File Server にデータを移行するにはどうすればよいですか?」というものです。 以前は、オプションは、Robocopy や WinRAR の使用、ファイルのコピーなど、手動によるものでした。2020 年 1 月に、AWS は、お客様がオンプレミスシステムから Amazon FSx およびその他のストレージサービスにデータを移行できるようにする完全マネージド型のデータ移行サービスである AWS DataSync の提供を開始しました。DataSync は Windows ファイルのプロパティとアクセス許可を保持し、差分の増分転送を許可するため、変更が加えられたデータのみがコピーされ、時間の経過とともに移行が発生します。さらに、DataSync は、圧縮と並列転送メカニズムを使用して高速転送を可能にすると同時に、転送中に使用される帯域幅の量を制御する機能も提供します。

AWS DataSync のアーキテクチャ図

このブログでは、Windows ファイルシステムから Amazon FSx for Windows File Server にデータを移行するように AWS DataSync をセットアップする方法について説明します。プロセスは、4 つの簡単なステップで構成されています。

  • ステップ 1: ターゲットストレージである Amazon FSx for Windows File Server ファイルシステムを作成します。
  • ステップ 2: ソースファイルシステムの近くに AWS DataSync エージェントをインストールします。
  • ステップ 3: データをソースストレージからターゲットストレージに移行する DataSync タスクを設定します。
  • ステップ 4: DataSync 移行タスクを実行します。

また、プロセス全体を説明する簡単な動画も作成しました。

ステップ 1: Amazon FSx ファイルシステムを作成する

最初のステップでは、ファイルのターゲットストレージである Amazon FSx for Windows File Server ファイルシステムを作成します。ファイルシステムを既存の Active Directory に結合できます。ファイルシステムを Active Directory に結合させることで、Amazon FSx でのファイルのアクセス許可は、オンプレミスと同じになります。その結果、ユーザーは同じファイルにアクセスできます。

AWS は、Amazon FSx ファイルシステムを作成するプロセスを説明する入門ガイド (または、ご希望の方のために動画) を作成しました。

このブログ投稿では、32 GiB の容量と 16 MB/秒のスループット容量を備えた複数の AWS アベイラビリティーゾーン (マルチ AZ) にまたがる Amazon FSx ファイルシステムを作成します。ファイルシステムを作成するとき、Amazon FSx では以下の項目を指定できます。

  • 作成するファイルシステムの大きさ (32 GiB〜65,535 GiB)
  • ストレージのタイプ (SSD または HDD)
  • 割り当てるスループットパフォーマンス
    • スループットパフォーマンスの設定をサポートするため、本サービスは、設定したストレージ容量に基づいて推奨されるスループット容量を提供します。ただし、アプリケーションの特定のニーズに合わせてカスタマイズすることもできます。
  • デプロイモード (シングル AZ またはマルチ AZ)
    • 1 つの AWS アベイラビリティーゾーンから 2 番目のアベイラビリティーゾーンへのデータのブロックレベルレプリケーションを実行するように Amazon FSx に指示するマルチ AZ アーキテクチャをデプロイすることをお勧めします。
  • ウィンドウ認証モード (AWS Managed Microsoft Active Directory または Self-managed Microsoft Active Directory)
    • 既存の Active Directory がある場合は、[セルフマネージド] オプションを選択します。
    • 次のスクリーンショットは、この例の目的のために、すでに選択されているすべての仕様を示しています。

Amazon FSx ファイルシステムのサンプル仕様

ステップ 2: AWS DataSync エージェントをインストールする

次のステップでは、DataSync エージェントをインストールします。AWS は、DataSync エージェントをソースファイルシステムへのネットワーク接続の近くにインストールすることをお勧めします。AWS は、このエージェントをオンプレミス環境にインストールするためにデプロイできるイメージを提供しています。AWS DataSync エージェントをインストールするには、AWS マネジメントコンソールにログインし、AWS DataSync サービスに移動します。[使用開始] ボタンをクリックします。

現在、次のスクリーンショットに示すように、AWS には、エージェントをデプロイするための 2 つのオプション、すなわち、VMware イメージまたは EC2 イメージがあります。オンプレミス環境からの移行については、VMware イメージをダウンロードしてください。

AWS には、エージェントをデプロイするための 2 つのオプション、すなわち、VMware イメージまたは EC2 イメージがあります。オンプレミス環境からの移行については、VMware イメージをダウンロードしてください。

サービスエンドポイントを選択することにより、DataSync エージェントから DataSync サービスへの通信方法を選択できます。最も一般的な 2 つのオプションは、パブリックサービスエンドポイントを使用したインターネット経由での通信、または AWS PrivateLink を使用した VPC エンドポイントを使用してのプライベート接続での通信です。

サービスエンドポイントを選択することにより、DataSync エージェントから DataSync サービスへの通信方法を選択できます

エージェントをデプロイしたら、エージェントの名前または IP アドレスを入力して、エージェントを DataSync サービスに登録する必要があります。次に、[キーの取得] ボタンをクリックします。

エージェントをデプロイしたら、エージェントの名前または IP アドレスを入力して、エージェントを DataSync サービスに登録する必要があります。次に、[キーの取得] ボタンをクリックします。

DataSync コンソールを開いたマシンがネットワークを介して DataSync エージェントと通信できない場合、通信エラー画面が表示されることがあります。簡単に修正するには、ネットワークを介して DataSync エージェントと通信できるホストで DataSync コンソールを開きます。

DataSync エージェントが正常に登録されると、コンソールに一覧表示されます。

DataSync エージェントが正常に登録されると、コンソールに一覧表示されます

DataSync エージェントのインストールの詳細については、こちらのドキュメントを参照してください。

ステップ 3: DataSync データ移行タスクを作成する

次のステップでは、ソースの場所、送信先となる場所、および移行設定を設定するタスクを作成します。ターゲットストレージの場所と同じ AWS リージョンに DataSync 移行タスクを作成することが重要です。

AWS マネジメントコンソールを開き、コンソールの右上にある [リージョン] のドロップダウンメニューから、Amazon FSx ファイルシステムが作成される AWS リージョンを選択します。次に、DataSync コンソールに移動し、[タスクの作成] ボタンを選択します。

ステップ 3.1: ソースの場所を指定する

[設定] の画面で、ソースの場所のオプションを指定します。SMB ファイルストレージからデータを移行しているため、[サーバーメッセージブロック (SMB)] オプションを選択し、DataSync エージェントを指定します。ソースの場所として使用する Windows ファイルサーバーの IP アドレス、およびそのサーバー上の Windows ファイル共有を指定します。私のラボでは、ソース Windows ファイルサーバーは 10.0.22.151 で、ソースファイル共有は share と呼ばれています。

[設定] の画面で、ソースの場所のオプションを指定します。

次に、ソースの場所からデータを読み取る権限を持つユーザーの資格情報を指定します。一般的な実装では、バックアップオペレーターグループのメンバーであるサービスアカウントを作成し、そのサービスアカウントを指定します。次のスクリーンショットは、この例の目的のために、すでに選択されているすべての仕様を示しています。

次に、ソースの場所からデータを読み取る権限を持つユーザーの資格情報を指定します

ステップ 3.2: 送信先となる場所を指定する

この手順では、データの移行先となる場所を指定します。ロケーションタイプの [送信先ロケーションの設定] で、[Amazon FSx for Windows File Server] オプションを指定します。前に作成した Amazon FSx ファイルシステムと、データをコピーする共有名を選択します。

このステップでは、データの移行先となる場所を指定します

また、Amazon FSx ファイルシステムにデータを書き込む権限を持つアカウントを指定する必要があります。ファイル、フォルダ、ファイルメタデータへの十分なアクセス許可を確保するために、Amazon FSx ファイルシステムの委任管理者グループのメンバーであるユーザーを選択することをお勧めします。詳細は、こちらを参照してください。

また、Amazon FSx ファイルシステムにデータを書き込む権限を持つアカウントを指定する必要があります

ステップ 3.3: DataSync タスク設定を指定する

次の画面では、次のスクリーンショットに示すように、DataSync タスク設定を設定します。以下では、これらの項目の設定に関するいくつかの提案を示しています。

  • DataSync タスクを複数回実行することを計画しており、ビジネス上の要件として、レプリケーションタスクが実行されるたびに送信先のすべてのデータを検証することが求められていない場合は、[転送されたデータのみを検証する] を選択します。この変更は、AWS DataSync タスクに対して、転送されたデータのみを検証するように指示を出します。各オプションの詳細については、こちらを参照してください。
  • AWS DataSync がデータを複製するために使用する帯域幅の量を制御する場合は、帯域幅制限を設定します。デフォルトでは、AWS DataSync は、利用可能な帯域幅を使用してデータ転送を促進するようにスケーリングします。

次の画面で、DataSync タスク設定を設定します

  • [スケジュール] オプションで、次のスクリーンショットに示すように、AWS DataSync タスクを実行するタイミングを指定できます。営業時間中のインターネット帯域幅への影響に懸念がある場合は、AWS DataSync タスクをカスタムスケジュールで実行するように設定し、オフピーク時間を指定できます。詳細は、こちらを参照してください。

[スケジュール] オプションで、次のスクリーンショットに示すように、AWS DataSync タスクを実行するタイミングを指定できます。

ステップ 4: DataSync 移行タスクを実行する

タスク設定を指定して DataSync タスクを作成すると、指定したスケジュールで実行されます。タスクをすぐに開始する場合は、DataSync タスクを選択し、[アクション] で [開始] を選択して開始できます。

タスク設定を指定して DataSync タスクを作成すると、指定したスケジュールで実行されます。すぐに実行することもできます。

次に、DataSync 移行タスクが動作していることを確認するために、Amazon FSx ファイルシステムにアクセスできる Windows Server にログオンします。ファイル共有を Amazon FSx ファイルシステムにマップします。ファイル共有を Amazon FSx ファイルシステムにマッピングする際にサポートが必要な場合は、こちらでプロセスを文書化しています。

AWS DataSync タスクがファイルをコピーすると、Amazon FSx ファイルシステムにファイルが表示されます。次のスクリーンショットでは、左側のファイルエクスプローラーはソースファイルシステムであり、右側のファイルエクスプローラーは Amazon FSx ファイルシステム上のファイルを含んでいます。

AWS DataSync タスクがファイルをコピーすると、Amazon FSx ファイルシステムにファイルが表示されます。

お疲れさまでした。

Windows ファイルシステムから Amazon FSx for Windows File Server にファイルをコピーするように AWS DataSync をセットアップしました。タスクの実行中、AWS DataSync はソースファイルを検査し、変更されたファイルのみをコピーします。プロセスのチュートリアルをご覧になりたい場合は、この動画をご覧ください (動画の 3:37 までスキップできます)。このブログ投稿の概要にも埋め込まれています。

クリーンアップ

ブログで説明されているリソースを使用しなくなった場合は、望まない料金が発生しないようにするために、不要な AWS リソースをクリーンアップすることをお勧めします。概念実証が完了したら、DataSync オブジェクト (DataSync エージェント、DataSync タスク、DataSync ソースの場所、および送信先となる場所など) を削除して、リソースをクリーンアップできます。次に、ステップ 1 で作成した Amazon FSx ファイルシステムを削除する必要があります。これにより、この概念実証で使用されるリソースからさらにコストを削減できます。

さらなる機能強化

このブログでは、この移行を設定するために、AWS DataSync および Amazon FSx for Windows File Server コンソールについて説明しました。AWS は、幅広い API インターフェイスも提供しています。プログラムで、ファイル共有設定を Amazon FSx に移行できます。API を使用してファイル共有設定を移行する方法の詳細については、このドキュメントを参照してください。

Microsoft Distributed File System (DFS) をデプロイしている場合は、新しい Amazon FSx ファイルシステムへのカットオーバーを合理化できます。これを行うため、Windows ファイルサーバーファイルシステムではなく、Amazon FSx ファイルシステムを指すように DFS 名前空間を変更します。Amazon FSx と Microsoft DFS の統合について詳しく知りたい方のために、この設定を実行する方法に関する簡単な動画を作成しました。

まとめ

このブログ投稿では、Windows ファイルストレージインフラストラクチャの維持に関連する時間と費用を削減したいお客様を AWS がどのようにサポートできるかについての情報を共有しました。これらのお客様が必要なのは、完全マネージド型のネイティブ Windows ファイルサービスソリューションを提供するクラウドソリューションに移行することだけです。Amazon FSx for Windows File Server は、これらのニーズを満たすために作成されました。また、AWS DataSync を使用して Windows ファイルストレージインフラストラクチャから Amazon FSx にデータを移行する方法を示しました。AWS DataSync は、Robocopy や WinRAR の使用、またはファイルの手動コピーといった従来の方法に代えて、データ移行タスクを自動化します。

詳細については、次の参考資料を参照してください。

お読みいただきありがとうございました。投稿で概説されているソリューションについてご質問がある場合は、コメントをお寄せください。