サンフランシスコ州立大学のコンピュータサイエンス学科には、約 400 名の大学生と約 100 名の大学院生が在籍し、教育と研究に励んでいます。現在、この学部では、Stanford Helix Group と協力して FEATURE と呼ばれる機械学習プロジェクトに取り組んでおり、そのプロジェクトは国立衛生研究所 (NIH Grant LM05652) によって支援されています。

FEATURE では、タンパク質の機能部位と他の 3 次 (立体) 分子構造を予測するために機械学習を使用しています。Dragutin Petkovic 教授はこのように説明しています。「機械学習の大規模な並列最適化には、数十万ものベクトルで構成される数千のトレーニングセットに対するサポートベクターマシン (SVM) アルゴリズムの応用が関係します。最適な SVM パラメータは、K-分割交差検証を使用した並列化された総当りのグリッドサーチによって発見されます。この最適化には、単独で同じ作業を何度も繰り返すことが含まれます」図 1 は、FEATURE プロジェクトについて説明したものです。

サンフランシスコ州立大学の AWS 導入事例のプロジェクト詳細

図 1: FEATURE プロジェクトの詳細

FEATURE では、他の革新的な科学プロジェクトと同じように、ハイパフォーマンスコンピューティングが際限なく必要になります。そのため、プロジェクトの研究者は、生物分子を詳細に調査するためにコンピューティングの需要は大きくなり、そのうちに大学の設備では足りなくなることがわかりました。コンピューティングリソースは、サンフランシスコ州立大学で共有されており、需要が高いときには、研究者は課題の規模と範囲を考え直す必要があり、またリソースが使用可能になるまでに長期間待つ必要がありました。さらに、このような制約によって、結果が出るまでに時間がかかり、科学者は自由に実験を行えませんでした。

科学者がコンピューティングリソースを必要とするのは一定期間のみであるため、不規則な使用のために大規模なリソースを購入して維持することは費用面から見て効率的ではありませんでした。研究チームでいくつかの選択肢を検討した結果、Amazon Web Services (AWS) によって提供されるコンピューティングリソースへのオンデマンドアクセスが、チームの目的にかなうものだということがわかりました。「Amazon Elastic Compute Cloud (Amazon EC2) の従量課金制モデルは、学内に大規模なサーバーを持つことに代わる最善の選択でした」と Petkovic 教授は述べています。

研究チームは、C、C++、Perl、Python を使用して FEATURE を構築しました。科学的および技術的にハイパフォーマンスコンピューティングを実現する自動プロビジョニングツールである MIT StarCluster を使用して、Amazon EC2 にクラスターをデプロイしました。タンパク質データバンクとタンパク質構造のデータベースは Amazon Elastic Block Store (Amazon EBS) ボリュームに取り込まれて管理と再利用が簡単になり、Amazon Linux のカスタムマシンイメージ (Amazon Linux AMI) を使用してアクセスできるようになりました。図 2 は、FEATURE プロジェクトのアーキテクチャを示したものです。

サンフランシスコ州立大学の AWS アーキテクチャ図

図 2: FEATURE プロジェクトのアーキテクチャ

AWS での FEATURE プロジェクトのパフォーマンスを評価するために、このチームはソフトウェアプロファイルと I/O ベンチマークによる評価を行い、パフォーマンスメトリクスを測定しました。Petkovic 教授はこのように述べています。「チームは、学内に小規模の 40 ノードのクラスターしかありませんでした。私たちはこれをクラウドと比較し、コストあたりの CPU サイクルの観点から見て Amazon EC2 が非常に優れていることを理解しました。また、必要に応じてスケールアップする機能を備えているという点でも優れていました。数週間かかっていた実験は、現在では一晩で実行できます。これは、科学者が常に作業に取り組むことができ、すぐに結果が得られるということです。AWS によって、科学的な調査を始めてから終えるまでの時間が大幅に削減できました」

Petkovic 教授は、コンピューティングコストを約 20 分の 1 に削減されたと推定しています。「学内の 40 ノードの小規模なクラスターは、1 つのコンピュータユニットにつき 1 時間あたり 1.71 USD で稼動していると見積もっています。比較すると、Amazon EC2 では、同等の伸縮自在なコンピュータユニットを 1 時間あたりわずか 0.08 USD で稼動できます」と同教授は説明しています。また、Petkovic 教授とそのチームは、AWS が提供する請求アラートやその他のコスト最適化ツールを利用して、サービスの使用コストを計画および管理しています。

「AWS により、高性能のリソースにオンデマンドでアクセスできるようになったため、サーバーインフラストラクチャの維持という面倒な作業から解放され、科学に集中できるようになりました。AWS を使用することで、機械学習について実験できる規模と範囲の限界が引き上げられました」と Petkovic 教授は語ります。

クラウドにおけるゲノミクスの詳細については、AWS ゲノミクスの詳細ページをご覧ください。

AWS がハイパフォーマンスコンピューティングにどのように役立つかの詳細については、HPC の詳細ページをご覧ください。