新機能 – Machine Learning を中核とする EC2 の予測スケーリング

AWS の歴史を振り返り、クラウド本来の特徴である動的なオンデマンド性を真の意味で象徴するようなサービスとは何であったかを思い起こしてみます。2 つありました。それは、2006 年のAmazon EC2 のスタートと 2009 年の CloudWatch Metrics、Auto Scaling、Elastic Load Balancing の同時スタートです。前者は計算能力へのアクセスをもたらし、後者はその計算能力へのアクセスを需要の変化に対応できるよう高速かしました。それ以来、これらのサービスに多数の機能を追加してきました。私の知る限りでは、今でもその重要性、基本性は変わっていません。

新しい予測スケーリング
本日、Auto Scaling は予測スケーリングの追加によりさらに強化されます。ユーザーが使用する EC2 から収集されたデータおよび弊社独自の観測結果から得られた情報をもとに、十分にトレーニングを重ねた Machine Learning モデルを使用して、予想されるトラフィック量 (および EC2 使用量) を日次パターンと週次パターンで予測します。当該モデルで予測を開始するには、履歴データを最低でも 1 日分必要とします。その予測結果は 24 時間ごとに再評価され、次の 48 時間分を予測します。

このモデルを使いやすくするために、最善を尽くしてきました。クリック 1 回で有効化し、次に、3 ステップのウィザードに従って観測およびスケーリング対象のリソースを選択します。EC2 インスタンスのウォームアップ時間を設定できます。また、実際および予測の使用状況を見やすく視覚化します。予測プロセスではスケーリングプランが作成され、Auto Scaled EC2 インスタンスのグループを 1 つまたは複数動作させることが可能です。

新しいスケーリングプランが動作を開始すると、日次ベースや週次ベースでピークに達する前に先を見越したスケーリングができるようになります。この結果、ユーザーのウェブサイトやビジネスに関してユーザーエクスペリエンス全体が向上し、オーバープロビジョニングを防止して EC2 コスト削減に役立ちます。

それでは、具体的にご覧いただきます。

動作中の予測スケーリング
まず Auto Scaling コンソールを開いて、[今すぐ始める] をクリックします。

観測および予測スケーリング対象のリソースを選択するには、3 つの方法があります。

EC2 Auto Scaling グループを選択し (この画像はありません)、グループに名前を割り当て、スケーリングプランを選び、[Enable predictive scaling] と [Enable dynamic scaling] の両方にチェックが入った状態にしておきます。

上の画面でも分かるとおり、予測スケーリングと動的スケーリングの両方でも、いずれか一方だけでも選択できます。予測スケーリングは、負荷を予測して最小容量をスケジューリングする機能です。動的スケーリングでは、ターゲットトラッキングを使用して、指定した CloudWatch メトリクスを特定のターゲットに合わせます。予測スケーリングにより、スケジュール済みの最小容量が既に設定されているため、2 つのモデルが同時にうまく機能します。

予測スケーリングを微調整することもできますが、最初はデフォルト値でうまくいくでしょう。