Amazon Web Services ブログ
Amazon EFS を Amazon ECS と AWS Fargate で使用するための開発者ガイド – パート 3
Amazon EFS を Amazon ECS と AWS Fargate で使用する方法に関するこのブログ記事シリーズのパート 3 へようこそ。参考までに、このブログ記事シリーズは次のように構成されています。
- パート 1: このブログ記事は、この統合の必要性とその範囲に関する背景情報を提供し、この機能により道が開かれ、お客様に役立つユースケースとシナリオの概要を示します
- パート 2: ECS と Fargate に基づきコンテナをデプロイする際の EFS のセキュリティの仕組みの詳細と、リージョンごとの ECS と EFS のデプロイのベストプラクティスに関する高レベルの考慮事項を扱います
- パート 3: [このブログ記事] コンテナ化されたアプリケーションの再利用可能なコードとコマンドを含む実用的な例を紹介します。アプリケーションは EFS を使用した ECS タスクにデプロイされたものです
この記事では、パート 1 とパート 2 で学んだことを試すためのサンプルコードを作成します。このブログを 2 つのメインブロックに分割します (2 つの個別の例を使用して)。その 2 つは以下のとおりです。
- ファイルシステムの永続性を必要とするアプリケーションを実行するためのスタンドアロンのステートフルタスク
- 共有ファイルシステムに並行して複数のタスクにアクセスする
これらの背後にある理論について詳しく知りたい場合は、パート 1 をご覧ください。次に、サンプルコードについて詳しく説明します。
これらの例では、ECS タスクは Fargate で実行されますが、EC2 インスタンスで同じタスクを実行する場合 (異なるタスク起動タイプを使用する場合) はまったく同じワークフローが適用されます。
サンプルを実行するための前提条件と考慮事項
以下の例は、少なくとも 2 つのパブリックサブネットと 2 つのプライベートサブネット (アベイラビリティーゾーンごとに 1 つ) を使用できる VPC があることを前提としています。AWS CLI から CloudFormation、さらには CDK まで、そのような VPC を作成する方法は数多くあります。この演習用に一時的な VPC を作成する標準的な方法がない場合は、こちらが適切なオプションとなるでしょう。
サンプルとコマンドでは、最新バージョンの適切な AWS CLI v2 環境があることも前提としています (以前のバージョンでは新しい統合がサポートされていない可能性があります)。クライアントに加えて、ユーザーは (Docker を使用して) コンテナイメージを構築する機能を持ち、jq
および curl
ユーティリティがインストール済みである必要があります。このブログ記事では AWS Cloud9 環境で eksutils を使用しましたが、前述の前提条件を持つ任意のセットアップを使用できます。
サンプルコードでは高度な自動化を実現することもできましたが、すべてのステップで何が行われているかをご理解いただけるように、適切なレベルの対話を行うように心がけました。これは主に学習用の演習です。本番環境対応の CI/CD パイプラインを構築する際にお勧めする方法ではありません。
各セクションでは、前のセッションで入力されたシステム変数を使用する可能性があるため、同じシェルコンテキストを維持することが重要です。便宜上、以下に概説するスクリプトとコマンドは、ターミナルでこれらの変数の内容をエコーし、ある時点でコンテキストを再作成する必要がある場合は、それらをログファイル (ecs-efs-variables.log
) の「上に立てる」ことを行っています。
お使いの端末から、お客様の環境とログファイルの初期化を表す変数を使用して、「配管」のレイアウトを作成するところから開始しましょう。この環境変数の設定に失敗すると、ここで示すサンプルでエラーが発生する可能性があります。
ファイルシステムの永続性を必要とするアプリケーションを実行するためのスタンドアロンのステートフルタスク
この例は、再起動後も設定を維持する必要がある既存のアプリケーションを模倣しています。この例は NGINX に基づいており、かなり基本的ですが、これから使用する機能を必要とするお客様のより複雑なシナリオを具体的に例示することを目的としています。
このカスタムアプリケーションは、設計上、スタンドアロンでのみ実行できます。これは事実上シングルトンです。重要な設定情報を /server/config.json
というファイルに保存します。このアプリケーションは、この情報をファイルシステムに保存するように制限されています。コードに変更を加えることはできません。アプリケーションアーキテクチャの特性の範囲内で作業する必要があります。
設定ファイルの情報は、アプリケーションがインストールされて初めて起動したときに生成されますが、タスクの再起動時にも保持する必要があります。まず、アプリケーションを起動すると RANDOM_ID
が生成され、非常に重要な /server/config.json
ファイルに保存されます。次に、一意のコード ID がウェブサーバーのホームページにインポートされます。アプリケーションを再起動する必要がある場合は、ファイルが存在するかどうかを確認します。存在しない場合は、アプリケーションが初めて起動されたと想定してファイルが作成されます。存在する場合、それを再作成するプロセスはスキップされます。
以下は、このアプリケーションの起動スクリプト (startup.sh
) にこのロジックをどのように実装しているかを示しています。
このアプリケーションは、特定のタイムゾーンの標準的な勤務時間中にのみ使用します。ここでは、朝 7 時にアプリを開始し、夜 7 時にシャットダウンするワークフローを作成します。これにより、アプリケーションの費用を半分に削減できます。
EFS 統合の前は、ECS タスクでこのアプリケーションを起動すると、再起動時に /server/config.json
ファイルの RANDOM_ID
が失われました。スクリプトは新しい ID でファイルを再生成するため、アプリケーションが不具合を起こします。
このアプリケーションをコンテナにパッケージ化することにしました。これを行うには、startup.sh
ファイルを作成したのと同じディレクトリ内に次の Dockerfile
を作成します。
これで以下の作業を行う準備ができました。
- standalone-app と呼ばれる ECR リポジトリを作成する
- イメージを構築する
- ECR にログインする
- コンテナイメージを ECR リポジトリにプッシュする
この時点で、EFS サポートなしで基本的な ECS タスクを作成して、一時的なデプロイの制限を示す準備ができています。その前に、タスクが実行ロールを引き受けることを許可する IAM ポリシードキュメントを作成する必要があります。ecs-tasks-trust-policy.json
というポリシードキュメントを作成し、次のコンテンツを追加します。
これで、次の内容で standalone-app.json
というタスク定義を作成できます。画像を編集する際は、必ず変数 $ECR_STANDALONE_APP_REPO_URI のコンテンツ、アカウント ID、リージョンを使用して行うようにしてください。
コマンドの次のバッチでは、以下のことを行います。
- ECS クラスターを作成してタスクを保持する
- タスク実行ロール (
task-exec-role
) を作成する - AWS マネージドの
AmazonECSTaskExecutionRolePolicy
ポリシーをロールに割り当てる - 上記のタスク定義を登録する
- ロググループを作成する
- セキュリティグループ (
standalone-app-SG
) を作成して設定し、ポート 80 へのアクセスを許可する
これは、一時的なタスクを使用して構築したセットアップで、アプリケーションがリサイクルされることを表しています。
次に、このタスクを開始および停止したときに何が起こるかを示します。そのために、ループで循環するスクリプトを作成します。スクリプトは、アプリケーションを 2 分ごとに 5 回起動および停止します。スクリプトは、タスクの実行中にアプリケーションをクエリします。
以下は standalone-loop-check.sh
のスクリプトです。
スクリプトに実行フラグを追加し (chmod + x standalone-loop-check.sh
)、それを起動します。出力は次のようになります。
ご覧のように、RANDOM_ID
は再起動のたびに変更され、これによりアプリケーションが不具合を起こします。再起動後も /server/config.json
ファイルを保持する方法を見つける必要があります。EFS を入力します。
この後 EFS ファイルシステムを設定し、ECS タスクからアクセスできるようにします。これを実行する AWS CLI コマンドに飛び込む前に、efs-policy.json
というポリシードキュメントを作成する必要があります。CLI で使用するこのポリシーには、安全でないトラフィックを拒否する 1 つのルールが含まれています。このポリシーは、ファイルシステムをマウントする機能を明示的に誰にも許可しません。
これで、EFS サービスを設定する準備ができました。コマンドの次のバッチでは、以下のことを行います。
- EFS ファイルシステムを作成する
- すべてのクライアントに転送中の暗号化を強制するデフォルトポリシーを設定する
standalone-app-SG
からポート 2049 (NFS プロトコル) へのインバウンドアクセスを許可するセキュリティグループ (efs-SG
) を作成して設定する- 2 つのプライベートサブネットに 2 つのマウントターゲットを作成する
- ディレクトリ
/server
にマップするstandalone-app-EFS-AP
という EFS アクセスポイントを作成する
これで、上記のセットアップを作成する AWS CLI コマンドを起動する準備ができました。
ファイルシステムに /server
ディレクトリをマウントするために EFS アクセスポイントを作成することを選択した理由の詳細については、パート 2 を参照してください。パート 2 では、アクセスポイントを使用する利点について説明しています。
EFS ファイルシステムが適切に設定されたので、アプリケーションにそれを認識させる必要があります。そのために、次のことを行います。
- EFS アクセスポイントをマップする権限を付与する IAM ロール (
standalone-app-role
) を作成します - タスク定義 (
standalone-app.json
) を次のように調整します。- EFS アクセスポイントをマップする権限を付与するタスクロールを追加する
- 上記で作成した EFS アクセスポイントに接続するためのディレクティブを追加する
standalone-app-task-role-policy.json
というポリシーを作成し、以下を追加して、EFS ファイルシステム ARN と EFS アクセスポイント ARN が正しく設定されていることを確認します。この情報は、上記の変数を印刷したときに画面に表示されます。または、ecs-efs-variables.log
ファイルを参照することもできます。このポリシーは、作成した特定のアクセスポイントへのアクセスを許可します。
standalone-app.json
タスク定義を開き、taskRoleArn
、mountPoints
セクション、および volumes
セクションを追加します。このスケルトンからファイルを再作成する (再カスタマイズする) か、すでにカスタマイズした元の standalone-app.json
タスク定義に上記のディレクティブを追加することができます。
これで、ECS と EFS の統合を実装するコマンドのバッチを起動する準備ができました。
これにより、タスクのライフサイクルを「データ」から切り離しました。この場合、データは単なる設定ファイルですが、何でもかまいません。以下は、設定したものを視覚的に表したものです。
先に使用したのとまったく同じスクリプトを起動するとどうなるかを見てみましょう。念のため繰り返しますが、このスクリプトは 5 回連続してタスクを繰り返し、2 分ごとに停止します。
前回の実行と違うところは何かありましたか? 設定 (この例ではファイル
はアプリケーションの再起動後も保持されます。スタンドアロンタスクが異なるアベイラビリティーゾーンでどのように開始されるかにも注意を払う必要がありますが、タスクはどこからでも同じファイルシステムに到達できます。任務を完了しました!/server/config.json
) が EFS 共有に移動したため、RANDOM_ID
共有ファイルシステムに並行して複数のタスクにアクセスする
このセクションでは、これまでに見てきたことを基にして、並行して動作するタスクが共通の共有ファイルシステムにどのようにアクセスするかを示します。このパターンをお客様が実現する無限の可能性へのプロキシとして、アプリケーションを使用し続けます (スケールアウト WordPress ワークロードのデプロイであろうと、並列機械学習ジョブであろうと)。
私たちの (架空の) アプリケーションは現在、より広く分散したコミュニティにサービスを提供しています。現在 24 時間年中無休でユーザーにサービスを提供しているため、勤務時間外にオフにすることはもうできません。それだけでなく、アーキテクチャに変更が加えられ、アプリケーションがスケールアウトできるようになりました。これは、サポートする必要がある負荷を考えると、歓迎すべき改善です。ただし、常に /server/config.json
ファイルを永続化するための前提条件があり、複数の ECS タスクが同じファイルに並行してアクセスできるようにするにはどうしたらよいかという問題を解決する必要があります。前のセクションで定義したタスクを、EFS /server
フォルダに対する読み取り/書き込み権限を持つこのアプリケーションの「マスター」として選択します。このセクションでは、/server
ディレクトリを指す同じ EFS アクセスポイントを利用し、4 つの ECS タスクのセットへの読み取り専用アクセスを提供して、ロードバランサーの背後にある負荷を処理します。
上記のアプローチは、POSIX アクセス許可をバイパスし、AWS ポリシーに EFS ファイルシステムへのさまざまなレベルのアクセスを委任する方法を示しています。詳細については、このブログシリーズの パート 2 をご覧ください。
scale-out-app-task-role-policy.json
という新しいポリシードキュメントを作成します。このポリシーは、アクセスポイントへの読み取り専用アクセスを許可します。EFS ファイルシステムの ARN と EFS アクセスポイントの ARN が正しく設定されていることを確認してください。
これで、新しいタスクロールを作成し、作成したポリシードキュメントをアタッチできます。
次に、scale-out-app.json
という新しいタスク定義を作成します。このファイルは、前のセクションで使用した standalone-app.json
タスク定義に似ていますが、顕著な違いがいくつかあります。
family
containerDefinitions/name
awslogs-group
およびawslogs-stream-prefix
taskRoleArn
(このセクションで作成したもの)accessPointId
これで、次の新しいタスク定義を登録できます。
これで、コマンドの最後のバッチを起動して、アプリケーションのスケールアウトバージョンのデプロイを作成する準備ができました。コマンドは次のことを行います。
- スケールアウトアプリケーションのセキュリティグループを作成して設定する (
scale-out-app-SG
) scale-out-app-SG
をefs-SG
に追加して、スケールアウトアプリが EFS マウントターゲットと通信できるようにする- ALB を作成および設定して、4 つのタスク間でトラフィックのバランスをとる
- ログを収集するための専用のロググループ (
/aws/ecs/scale-out-app
) を作成する - 4 つの Fargate タスクを開始する ECS サービスを作成する
次の図は、作成したものを示しています。
アプリケーションが実際にどのように動作するかを見てみましょう。これを行うには、curl
がロードバランサーのパブリック DNS 名にヒットするループを実行して、ホームページをクエリします。以下は scale-out-loop-check.sh
スクリプトです。
スクリプトに実行フラグ (chmod + x scale-out-loop-check.sh
) を追加して起動します。出力は次のようになります。
ご覧のように、4 つのタスクすべてが ALB によって分散されており、全員が、現在共有されている /server/config.json
ファイルからの同じ RANDOM_ID
で応答しています。繰り返しになりますが、これらのタスクは設計上、設定したアベイラビリティーゾーン全体にデプロイされますが、同じデータにアクセスできます。任務を完了しました!
環境を壊す
作成した環境を壊す段階になりました。以下は、このブログ記事で実装したリソースを削除するコマンドのリストです。
この演習のために VPC を作成した場合は、忘れずに削除してください。
まとめ
これで、このブログシリーズは終了です。パート 1 では、ECS と EFS の統合の基本とコンテキストについて説明しました。パート 2 では、EFS へのアクセスを保護する方法に焦点を当てて、アーキテクチャの考慮事項に関する技術的な詳細を詳しく説明しました。この最後のパートでは、すべてを結び付け、先の記事で見たものを実装する方法の例を示しました。これで、統合の適用可能性を理解し、統合を使ってお客様のニーズに合ったものを構築するための知識を身につけるための土台が整いました。