1 週間
2、3 日
生産性の高い機械学習モデル開発環境の提供
創薬研究に求められるセキュリティの確保
概要
医薬品、食料品および化粧品等の製造販売を手がける大塚製薬株式会社。革新的な新薬の創出が求められる中、同社は創薬研究環境にアマゾン ウェブ サービス(AWS)を採用。セキュリティを担保しながら柔軟な計算環境を研究者に提供するため AWS ParallelCluster や Amazon SageMaker といった多様なサービスを活用し、コストと性能の両立を進めています。同社は現在、莫大な計算リソースが必要とされる計算化学・構造解析などの用途を中心にAWSのサービスを活用しており、特にクライオ電子顕微鏡単粒子解析では、ワークステーションで 1 週間を要していた処理が、2、3 日に短縮されるなどの成果をあげています。
ビジネスの課題 | 研究者の要望に応えるために俊敏性の高いクラウドを導入
大塚製薬の医薬品事業では、最重点領域の精神疾患、神経疾患、がん・免疫に加え、循環器・腎、感染症、眼科、皮膚科領域を中心とした医薬品の研究開発を行っています。徳島のほかグローバルにも研究拠点を持つ同社は、2022 年 8 月に大阪府箕面市に新たな研究施設となる『大阪創薬研究センター』を開所し、最先端のテクノロジーを駆使した革新性の高い創薬の実現を目指しています。
近年、創薬の研究開発では、実験機器から得られるビッグデータや、臨床現場で得られるリアルワールドデータ、行政などが提供するオープンデータなどの利活用が不可欠となっています。同社は、ハイパフォーマンスコンピューティング(HPC)や機械学習を用いた研究環境の整備を進めているものの、従来のオンプレミス環境ではハードウェアの調達や拡張面に課題がありました。
「創薬研究現場のデジタル化においては、研究者の着想にフットワークよく応えていく必要があります。そのためには、俊敏性の高いクラウドの活用と内製開発の環境が欠かせません」と語るのは、研究管理部 サイエンティフィックパートナリング 課長の稲葉智也氏です。
「一方で、非常に機密性の高い情報を扱うためセキュリティの確保がクラウド活用推進のための必要条件となっていました」 (稲葉氏)
このような背景から、研究部門におけるクラウド活用推進に際しては、セキュリティと内製開発の 2 つを重視して検討を開始しました。
「機密情報を扱う観点から、セキュリティは最優先事項となります。当初、外部にデータを置くことを不安視する意見があったものの、各種の設定を自分たちで検証して機能の理解を深めていくことで、高度なセキュリティ環境を構築可能であることが十分に納得できました。また、研究業務に寄与するアプリケーションを整備していくためには、内製により試行錯誤を繰り返すような取り組みが不可欠でした」(稲葉氏)
セキュリティを担保しながら解析したいタイミングで手元に計算リソースを用意できる AWS は、研究現場のニーズに迅速に対応できるため好評です”
稲葉 智也 氏
大塚製薬株式会社
研究管理部 サイエンティフィックパートナリング
課長
ソリューション | AWS ParallelCluster をはじめとした多様なサービスを活用
大塚製薬は、2020 年秋頃より研究環境のクラウド化に着手するにあたり、タンパク質の立体構造を解析するクライオ電子顕微鏡を用いた創薬研究に着目しました。いち早くクライオ電子顕微鏡由来データに基づく研究を推進するために、クラウド上に 解析用のHPC 環境を構築するプロジェクトが始動しました。
クラウドサービスには AWS を採用し、HPC 環境の構築には計算ノードを自動スケールするクラスター管理ツールとして AWS ParallelCluster を選択しました。選定の理由を研究管理部 梶原理希氏は「計算環境を柔軟に構築できるAWS ParallelCluster は非常に有用なサービスでした。ジョブスケジューラーや、並列計算を行うための環境がマネージドで提供されるため、自社での構築負荷がかからないこと、Relion と呼ばれるソフトウェアを中心に、クライオ電子顕微鏡データの解析で標準的に利用する解析ソフトの稼働実績があったことが決め手となりました」と語ります。
AWS ParallelCluster による HPC 環境の構築を含めてAWS環境の整備は 2021 年 2 月から開始し、同年 8 月にはParallelClusterの運用を開始しました。「AWS ParallelCluster を設定して解析ソフトをインストールするまでの作業は 1 週間で完了し、すぐに PoC* を開始することができました。」(梶原氏)
HPC 環境では、ジョブに応じて CPU/GPU を搭載した最新の Amazon Elastic Compute Cloud(Amazon EC2) インスタンスを使い分け、更にスポットインスタンスの活用や最新のGPUを積極的に利用することでコストを最適化しています。また、計算環境だけでなく、一回あたり10 TB近いクライオ電子顕微鏡のデータを扱うため、物理デバイスの Amazon Snowcone を利用した Amazon S3 への転送や、計算実行時にはフルマネージド型の分散ファイルシステム Amazon FSx for Lustre に転送して処理を行うなど多様なサービスを活用しています。
また、同社では創薬における機械学習のモデル開発においてもAWSが活用されています。機械学習向け統合開発環境である Amazon SageMaker Studio を採用し、一般的な学習モデルの構築用途や、Anaconda を使った Python 環境として利用しています。
「AlphaFold2 と呼ばれるタンパク質の立体構造を予測する機械学習モデルを評価する際にも、Amazon SageMaker Studio を活用し、迅速にGPU を用いた検証を実行できました。Amazon SageMaker Studio であれば、オンプレミス環境で実行した既存の学習モデルを AWS へ容易に移植し、必要な時だけAWS の潤沢なリソースを使って安価に学習ができるため、重宝しています」(梶原氏)
また、創薬研究の機密データを守るセキュリティの確保においても、Amazon EC2 インスタンス上の脆弱性を診断する Amazon Inspector など、多様なAWS のサービスを活用してセキュアな運用体制を構築しています。
*Proof of Conceptの略で、概念実証を意味する。
アーキテクチャ
導入効果 | 7 日要していた解析期間を、最速で 2、3 日に短縮
AWS による HPC 環境の構築は、分析時間の短縮を実現するとともに、研究者の待ち時間をなくすパラダイムシフトをもたらしつつあります。
「クライオ電子顕微鏡のデータ解析では、1 構造の解析に既存のオンプレミス環境で 7 日かかっていた解析期間を、最速で 2、3 日に短縮することができました。解析コストは当初懸念点でしたが、使い方が洗練されることで大幅にコストが削減できたことは大きな発見でした」(梶原氏)
オンプレミス環境では半年近くかかっていた計算環境の調達が1 週間程度に短縮されたことで、研究者が思い立った際にすぐに大規模な解析することも可能になりました。また、クラウド環境によりオンラインで利用ができるため、研究所の所在場所に縛られることもなくなりました。リモートアクセスには、高性能のリモートディスプレイソフトウェアであるNICE-DCV を活用し、3D 構造のデータをリアルタイムに表示しながら解析を実行することも可能です。
「解析したいタイミングで手元に環境を用意できる AWS は、研究現場のニーズに迅速に対応出来るため好評です。クライオ電子顕微鏡のデータ解析では、研究員がAWS の HPC 環境を使っていく中で、次第に解析時間の短縮やコスト軽減のメリットを実感してもらうことができており、現在では積極的に活用して貰えるようになってきました」(稲葉氏)
今後は、HPC のユースケースを分子動力学計算、バイオインフォマティクスなどに拡大し、多くのワークロードを実行していく予定です。また、飛躍的に増加していくデータに対して、研究者がいつでも欲しいデータにアクセスできるように、AWS のストレージサービスを活用してアーカイブやバックアップの環境を整備していく計画です。さらには、Amazon SageMaker の活用基盤を拡張し、将来的にはデータのプリプロセスから予測モデルのデプロイや運用までをカバーする MLOps の構築にも取り組んでいくとしています。
「現場のニーズを捉えながら、AWS のサービスをベースに新たな技術を研究部門に提供し、創薬研究における競争力の向上に貢献していきます」(稲葉氏)
カスタマープロフィール: 大塚製薬株式会社
“世界の人々の健康に貢献する革新的な製品を創造する” という企業理念のもと、「医療関連事業」と「ニュートラシューティカルズ関連事業」の 2 つの事業を展開。医療関連事業では、中枢神経領域や腎・循環器領域を中心に、新たな治療薬を提供する。健康の維持・増進のための製品を提供するニュートラシューティカルズ関連事業では、『ポカリスエット』『オロナミンCドリンク』『カロリーメイト』など独創的な製品を展開している。
稲葉 智也 氏
梶原 理希 氏
ご利用中の主なサービス
AWS ParallelCluster
AWS ParallelCluster は、オープンソースのクラスター管理ツールで、AWS でハイパフォーマンスコンピューティング (HPC) クラスターをデプロイして管理することを容易にします。
詳細はこちら »
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) は、500 以上のインスタンスと、最新のプロセッサ、ストレージ、ネットワーク、オペレーティングシステム、購入モデルを選択でき、ワークロードのニーズに最適に対応できる、最も幅広く、最も深いコンピューティングプラットフォームを提供しています。
詳細はこちら »
Amazon S3
Amazon Simple Storage Service (Amazon S3) は、業界をリードするスケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。
詳細はこちら »
Amazon FSx for Lustre
Amazon FSx for Lustre は、人気のある Lustre ファイルシステムのスケーラビリティとパフォーマンスを備えたフルマネージド共有ストレージを提供します。
詳細はこちら »
今すぐ始める
あらゆる業界のさまざまな規模の組織が AWS を活用してビジネスを変革し、日々ミッションを遂行しています。当社のエキスパートにお問い合わせいただき、今すぐ AWS ジャーニーを開始しましょう。