AWS なら数千コアを同時に立ち上げて計算ができるため、従来 30 日かかっていた計算を 1 日で終えることも可能です。
これは数十億レベルのデータを解析して新しい創薬の可能性を追究していく上で大きなメリットとなります。
青島 健 氏 エーザイ株式会社 hhc データクリエーションセンター データサイエンスラボ 部長

研究開発のプラットフォームに AWS のハイパフォーマンスコンピューティング(HPC)インスタンスを採用。病気の原因となるタンパク質と効果を示す化合物の最適な組み合わせを見つけるバーチャルスクリーニングでは、数千コアを使って一気に計算することで、従来 30 日かかっていた計算を 1 日で終えることも可能になりました。
エーザイ株式会社は、認知症治療剤や抗がん剤などの医療用医薬品を主体に、一般医薬品までを手がける製薬企業です。AWS で個々の研究に最適なインスタンスを立ち上げ、創薬研究に必要な ICT リソースを柔軟に活用できるようになり、開発生産性が大幅に向上しています。


 

エーザイは、患者様とそのご家族を第一とする医療を目指す「ヒューマン・ヘルスケア(hhc)」を企業理念に、医薬品の開発/製造/販売に取り組んでいます。同社は ICT を活用してイノベーションを推進する方針を掲げ、中核組織として hhc データクリエーションセンター(以下、hDAC)を創設。「AI を含む高度なデータサイエンス技術を駆使して創薬を加速することがミッションです。データサイエンスラボでは、ゲノム、化合物、電子カルテ、レセプトなど、創薬に関わるあらゆるデータを一元的に管理/分析することで、患者様のニーズに合致した価値の早期創造を目指します。」と語るのは、hDAC データサイエンスラボ 部長の青島健氏です。

一般的に創薬の現場では、病気の原因となるタンパク質を見つけ出す探索研究から始まり、タンパク質と結合して働きを抑える新しい化合物を創り出します。新薬の候補となった化合物は、開発研究の過程で物理化学/生物学的性質などを評価し、臨床研究を経て市場に届けられます。しかし、人体を構成するタンパク質は 10 万種類以上あり、病気に関連するタンパク質と結びつく化合物候補も数千万種類以上に及ぶため、大量のデータを生成/収集/分析できる環境が必須となります。同社はこれまで分析用の環境をオンプレミスで用意してきましたが、コストを抑えて新薬開発のスピード化を図るには、ニーズに応じてリソースを調達できるクラウドの活用が有効と考えるようになりました。

エーザイでは 2010 年、AWS の US リージョンにパイロット環境を構築してクラウド活用について検証しましたが、当時は WAN 回線による解析データの海外転送に時間を要するなどの理由で本格導入には至りませんでした。その後、数年のブランクを経て 2016 年 4 月に AWS 環境の整備に着手し、同年 10 月から Amazon EC2、Amazon ECS、Amazon S3 などで構成された HPC プラットフォームの利用を開始しました。

「VPC (Virtual Private Cloud) でセキュリティが確保できるようになったことに加え、オンプレミスから AWS への初期データ移行には AWS Snowball を使い、約 50TB の既存の Raw/解析データをセキュアに移設できました。移設後発生するデータについては、AWS Direct Connect を使うことで、リアルタイムにデータを AWS へアップロード可能になりました。2010 年の AWS 利用検討時は筑波研究所から US まで 1.5〜2 週間かかるという計算でしたから、格段の進歩です。」と hDAC データサイエンスラボ 主任研究員の三浦雄治氏は語ります。

化合物データは製薬企業にとって最も重要な機密事項であり、そのデータをクラウド環境で扱うことは業界内でも先進的な決断でした。hDAC データサイエンスラボ ディレクターの瀬能敬司氏は次のように語ります。

「ビッグデータを活用するには、オンプレミスにこだわり続けているわけにはいきません。AWS なら解析へのフレキシビリティさとセキュリティ確保が確実に保て、情報漏洩のリスクがないことを経営トップに論理的に説明することで理解を得ました。」

AWS で構築した HPC プラットフォームは現在、創薬の探索研究、主にタンパク質と化合物の組み合わせをコンピュータ上で検証するバーチャルスクリーニングで利用されています。リソースが限られるオンプレミス環境では、処理時間を短くするため 1,000 万以上ある候補化合物をあらかじめ 1 万程度まで絞り込んでいました。しかし、AWS のリソースを活用すると約 1,000 万の化合物と約 200 種類のタンパク質の組み合わせを総当たりでシミュレーションできるようになるなど、候補となる化合物を獲得する確率も高まります。

エーザイでは、AWS 提供の CfnCluster でクラスター環境を構築し、数千コアのリソースを時間課金で利用しています。

「AWSによって、今までの常識を超えた解析が可能になりました。オンプレミス環境では数百コアが限界でしたが、AWS なら数千コアを同時に立ち上げて計算ができるため、従来 30 日かかっていた計算を 1 日で終えることも可能です。また、オンプレミス環境での大規模計算は他の研究員と調整が必要でしたが、AWS ではそれぞれが目的に応じた HPC 環境を立ち上げて作業できるようになりました。現在利用しているAWS のリソースをオンプレミスで調達しようとすると費用は 1 億円以上かかってしまいますが、AWS ではその都度必要なだけリソースが調達できます。目的に応じてスポットインスタンスも活用し、速度とコストのバランスもコントロールしています。」と、hDAC データサイエンスラボ マネージャーの長岡和也氏は語っています。

計算時間の短縮は、後行程の計算に着手するまでの時間短縮にも直結し、開発コストの削減や開発生産性の向上につながっています。また、アプリケーションや OS、計算に必要なメモリ容量などに合わせて最適なインスタンスを立ち上げたり、より高速なインスタンスに切り替えられることもメリットです。hDAC データサイエンスラボ 主任研究員の赤田圭史氏は「Amazon EC2 の P2 インスタンスで実行していた脳波解析の計算を、強力な GPU が搭載された P3 インスタンスが日本でリリースされたタイミングで切り替えたところ、実測で 7 倍近く計算スピードが速くなり、1 週間以上かかっていた機械学習の計算結果が 3~4 日で返ってくるようになりました。定められたタイムラインの中で、これまで 1 回しか行えなかった計算を 3 回行うことも可能です。」と語ります。

AWS のサポート体制については、導入前の検証(PoC)段階での環境整備の支援から、導入後のリソースの上限緩和申請への対応などが評価されています。「革新的新薬創出という当社のニーズを汲んで、柔軟に要望に応えていただけました。」(赤田氏)

今後については、オンプレミスと AWS のハイブリッドで利用している HPC 環境を徐々に AWS にシフトして、ゲノム解析や、機械学習による画像解析など、創薬研究のあらゆるフェーズでの適用を検討しながら開発期間の短縮と開発コストの削減を進めていく考えです。また、電子カルテ、レセプトといったリアルワールドデータを蓄積したデータレイクをクラウド環境で稼働させ、さまざまな因子分析を実施することで個別化医療に貢献していくことを明らかにしています。

「今では、外部のクラウドを利用しているというより、エーザイの中に AWS があるかのように、セキュアな環境で医薬品の研究開発を実体験できています。今後もさまざまな解析に利用を拡大し、まだ治療法が見つかっていないメディカルニーズに向けて新薬の創出に挑んでいきます。」と青島氏は意欲的に語っています。

青島 健 氏

瀬能 敬司 氏

長岡 和也 氏

赤田 圭史 氏

三浦 雄治 氏


AWS クラウドが ハイパフォーマンスコンピューティング (HPC) にどのように役立つかに関する詳細は、AWSでのハイパフォーマンスコンピューティングの詳細ページをご参照ください。