Amazon Web Services ブログ

新機能 – Machine Learning を中核とする EC2 の予測スケーリング

AWS の歴史を振り返り、クラウド本来の特徴である動的なオンデマンド性を真の意味で象徴するようなサービスとは何であったかを思い起こしてみます。2 つありました。それは、2006 年のAmazon EC2 のスタートと 2009 年の CloudWatch Metrics、Auto Scaling、Elastic Load Balancing の同時スタートです。前者は計算能力へのアクセスをもたらし、後者はその計算能力へのアクセスを需要の変化に対応できるよう高速かしました。それ以来、これらのサービスに多数の機能を追加してきました。私の知る限りでは、今でもその重要性、基本性は変わっていません。

新しい予測スケーリング
本日、Auto Scaling は予測スケーリングの追加によりさらに強化されます。ユーザーが使用する EC2 から収集されたデータおよび弊社独自の観測結果から得られた情報をもとに、十分にトレーニングを重ねた Machine Learning モデルを使用して、予想されるトラフィック量 (および EC2 使用量) を日次パターンと週次パターンで予測します。当該モデルで予測を開始するには、履歴データを最低でも 1 日分必要とします。その予測結果は 24 時間ごとに再評価され、次の 48 時間分を予測します。

このモデルを使いやすくするために、最善を尽くしてきました。クリック 1 回で有効化し、次に、3 ステップのウィザードに従って観測およびスケーリング対象のリソースを選択します。EC2 インスタンスのウォームアップ時間を設定できます。また、実際および予測の使用状況を見やすく視覚化します。 予測プロセスではスケーリングプランが作成され、Auto Scaled EC2 インスタンスのグループを 1 つまたは複数動作させることが可能です。

新しいスケーリングプランが動作を開始すると、日次ベースや週次ベースでピークに達する前に先を見越したスケーリングができるようになります。この結果、ユーザーのウェブサイトやビジネスに関してユーザーエクスペリエンス全体が向上し、オーバープロビジョニングを防止して EC2 コスト削減に役立ちます。

それでは、具体的にご覧いただきます。

動作中の予測スケーリング
まず Auto Scaling コンソールを開いて、[今すぐ始める] をクリックします。

観測および予測スケーリング対象のリソースを選択するには、3 つの方法があります。

EC2 Auto Scaling グループを選択し (この画像はありません)、グループに名前を割り当て、スケーリングプランを選び、[Enable predictive scaling] と [Enable dynamic scaling] の両方にチェックが入った状態にしておきます。

上の画面でも分かるとおり、予測スケーリングと動的スケーリングの両方でも、いずれか一方だけでも選択できます。予測スケーリングは、負荷を予測して最小容量をスケジューリングする機能です。動的スケーリングでは、ターゲットトラッキングを使用して、指定した CloudWatch メトリクスを特定のターゲットに合わせます。予測スケーリングにより、スケジュール済みの最小容量が既に設定されているため、2 つのモデルが同時にうまく機能します。

予測スケーリングを微調整することもできますが、最初はデフォルト値でうまくいくでしょう。

あらかじめ選択された 3 つのメトリクスから 1 つを予測できます (これは全般設定にあります)。

またはカスタムメトリクスを予測します。

スケーリングを実行せずに予測するオプションもあります。

また、バッファ時間を設定することで新たに起動したインスタンスがウォームアップでき、予測された時間にトラフィックを処理できます。

あと数回クリックすれば、スケーリングプランが作成され、学習/予測処理が開始します! コンソールに戻ると、CPU 使用率 (選択したメトリクス) およびインスタンス数の予測を確認できます。

予測を実行するスケーリングアクションを確認できます。

Auto Scaling グループ向けの CloudWatch メトリクスも確認できます。

そして大事なのはここです!

予測スケーリングについて、留意することがいくつかあります。

タイミング – 予測が初期設定されスケーリングプランが実行されると、プランは毎日更新され、予測は次の 2 日間、実行されます。

コスト – 予測スケールは無料で使用でき、AWS の料金も下がる可能性があります。

リソース – AWS では、EC2 インスタンスのサポートを開始しました。他の AWS リソースタイプについても、追ってサポートする予定です。

適用性 – 予測スケーリングは、定期的にトラフィックが急上昇するウェブサイトやアプリケーションに最適です。負荷の急増が周期的ではなく予測不可能な状況で役立つようには設計されていません。

長期間のベースライン – 予測スケーリングでは、過去の要求に基づいて最小容量を維持します。そのため、メトリクスのギャップが偶発的にスケールインすることはありません。

今すぐ利用可能です!
予測スケーリングは利用可能になりました。本日より、米国東部 (バージニア北部)米国東部 (オハイオ)米国西部 (オレゴン)欧州 (アイルランド)アジアパシフィック (シンガポール) の各リージョンでご利用いただけます。

Jeff;