Amazon Web Services ブログ
AWS Cloud Financial Managementベンチマーク調査
今回のブログではAWSコスト管理とAWS利用状況に関するベンチマーク調査結果を紹介します。
AWSへ移行後のコスト最適化支援としてCloud Financial Management (CFM )プログラムを提供してきました。CFMの支援プロセスはCFM分析専門チームが、お客さまのAWS Cost Explorerから得られるデータを分析し、コスト最適化の実行計画を提示します。CFMのコスト最適化のアプローチの概要と、日本のお客さまにおけるAWS利用状況に関するベンチマーク調査結果をお伝えします。
Savings Plans /リザーブドインスタンスの購入オプションの利用
迅速にAWSコストを削減する方法の一つとしてまず検討対象としてあがるのは、Savings Plans (SP)やリザーブドインスタンス (RI)の購入オプションの利用となります。SPは1 年または 3 年の期間で特定の使用量 (USD/時間で測定) をコミットすることで、オンデマンド料金と比較して最大で 72%のAWSコスト削減を実現する購入オプションです。例えば、図1のように$10/時間の使用量をコミットした場合、1時間あたり$10まではEC2インスタンスなどをSP料金で利用できます。コミットを超えた使用量についてはオンデマンド料金で課金されます。SPは、割引率が高いEC2 Instance Savings Plansと、柔軟性が高いCompute Savings Plansの主に2種類が存在します。対してRIもSPと同様に1年間もしくは3年間の利用をコミット頂くことでオンデマンド料金に比べて大幅な割引価格が適用される購入オプションです。Amazon EC2、Amazon RDS、Amazon Redshift、Amazon ElastiCache、Amazon OpenSearch Serviceの5つのAWSサービスに対して利用できます。ワークロードの特性や環境等でSP/RI、オンデマンド、スポットインスタンスをうまく組み合わせ、SP/RIカバー率(インスタンスの総稼働時間に対する適用するSP/RIの稼働時間の割合)を検討していきます。
インスタンスの再選定
EC2インスタンスのCPUやメモリ等の使用率が想定より高くない場合において、柔軟にインスタンスサイズを変更することが可能なのがクラウドのメリットの一つとなります。また、AWSでは毎年新しいCPUを備えたインスタンスをリリースしており、世代として管理しています。この世代を常に最新化することでコスト減とパフォーマンス増を実現できます。
未使用リソースの停止
コンピューターリソースをほとんど利用しておらず、当該AWSサービスを利用していない場合は、停止や削除をすることで不要な課金を抑えます。例えば、AWS Trusted Advisorを利用することで不要なリソースの特定と削除することによるコスト削減額を確認できます。
インスタンスの稼働調整
未使用時にインスタンスを停止し、需要に応じてリソースを適用的に変動させることで不必要な稼働と課金を抑えます。例えば開発環境において、土日・平日夜間において開発を行わないようであれば、AWS Instance Schedulerを用いてスケジュール調整を行い、稼働を抑制します。
Amazon S3ストレージの効果的な利用
オブジェクトストレージであるS3は容量単価としてはブロックストレージのEBSよりも安価に利用できます。従って、高いIOPSが要件としてなく、またAPIでデータ連携が可能なアプリケーションやシステムであればS3を利用することがAWS利用費用削減の観点では最適なアプローチとなります。さらにS3には7つのストレージサービスを保有しており、アクセス頻度や要件に応じて適切に選択することでAWSを最適に利用することができます。また、どのS3サービスを利用すればよいかの判断が難しい場合は、アクセス頻度に応じて自動的にストレージサービスを選択する機能を保有するS3 Intelligent Tieringを利用するのも一つの打ち手となります(図2) 。
ベンチマーク結果
続きましてCFMプログラムで支援した日本のお客さま203社のAWS利用状況の平均値を示します(表1)。
表1. CFMベンチマーク調査結果(203件)
(*1) SP/RIカバー率 :インスタンスの総稼働時間に対するSP/RIが適用されている割合
SP/RI利用率:購入したSP/RIに対して適用されている割合(どの程度SP/RIを使い切れているかの程度)
(*2) 適正EC2サイズ利用率:インスタンスの総稼働時間に対する適正なインスタンスサイズのEC2の稼働時間の割合
(当該分析における適正なインスタンスサイズの定義:分析した日から遡って過去2週間の利用におけるCPUの最大利用率が40%超のインスタンス)
(*3) Weekend Elasticity:オンデマンドインスタンスにおける平日の稼働時間に対する土日の非稼働時間の割合(平日に対する土日の稼働抑制の程度)
(*4) gp3利用率:旧世代のEBS gp2に対するgp3のデータ容量利用の割合
S3利用率:EBSに対するS3標準のデータ容量利用の割合
S3-IA利用率:S3標準に対するS3標準-低頻度アクセスのデータ容量利用の割合
S3-Glacier利用率:S3標準に対するS3 Glacier Flexible Retrievalのデータ容量利用の割合
EC 2インスタンスに対するSP/RIのカバー率は48%であるのに対して、RDSは33%、その他のサービスは9〜19%という結果となっています。EC2やRDSと比較してRedshift、ElastiCache、OpenSearchについては用途や利用が限定されるため、RIの適用により慎重になっていることから、RIのカバー率が相対的に低くなっている可能性が考えられます。また、特定の部門やプロジェクトで利用されていて、IT部門が利用状況を把握できず、RIの適用が進んでいない、ということも考えられると思います。また、SP/RIの利用率ではEC2のRI利用率 (94%)と比較してSP利用率 (99%)が高いことからもより柔軟に適用されるSPを利用することが有効であることもわかります。
適正EC2サイズ利用率は71%であることから、オーバサイジングなインスタンスの割合が29%とまだ多く、定期的な確認・見直しが必要であることが想定されます。ストレージサービスについては、2020年12月にリリースされた最新のEBSボリュームであるgp3の利用率が7%とまだ低く、またS3標準-低頻度アクセス (S3-IA)の利用率も2%であり、適切なストレージに切り替えることによるコスト削減の余地があることがわかります。
また、ベンチマーク調査の結果、EC2のSP/RIのカバー率の高低によって興味深い違いがあることがわかりました。表2は、A. SP/RIのカバー率が 低いグループ(40%未満)とB. 高いグループ(40%以上)の2グループに分けた調査結果ですが、ほとんどの項目でSP/RIのカバー率の高いグループがより最適化が進んでいます。一方で、最新世代インスタンス利用率、適正なEC2サイズ利用率は逆にSP /RIのカバー率が低い利用者の方が良い結果になっています。SP/RIは1年あるいは3年の利用をコミットすることで得られる割引です。すなわち1年あるいは3年間そのインスタンスを使い続けることを想定しているのでしょう。そのため、SP/RIのカバー率の高い利用者の方が、新しい世代のインスタンスへの変更や、インスタンスサイズ適正化の優先度を下げている傾向にあることが推測されます。例えば2022年3月時点で、東京リージョンでm6i.2xlargeのLinuxのインスタンスに1年全額前払いのRIを購入したときに得られる割引額は38%です。一方m6i.2xlargeからm6i.xlargeにダウンサイジングしたときのコスト削減効果は50%です。過剰なスペックのインスタンスをダウンサイジングしたときのコスト削減効果が大きく、重要であるとご理解いただけると思います。SP/RIの更新のタイミングや定期的にインスタンスの適正化の検討を推奨します。
表2. SP/RIのカバー率による最適化の違い
※橙枠:最適化が進んでいる項目
CFMのコスト最適化アプローチとそれに基づいた日本のお客さまにおける利用形態を紹介いたしました。ワークロードの特性や利用する環境、要件に応じてそれぞれの取りうるアプローチは異なりますが、ベンチマーク調査結果を一つの参考に現時点での利用を確認した上で必要に応じて見直すことが肝要です。
本ブログはシニア事業開発マネージャーの門畑顕博と仁戸潤一郎が担当しました。