Amazon Web Services ブログ
AI for Science – AI がもたらす研究新時代
本記事は、大学・研究機関の研究者、R&Dディレクター、ラボマネージャー、そして研究のデジタル化やAI活用を検討されている科学技術系のリーダーの方々に向けて書かれています。
文部科学省は 2026 年 4 月、「AI for Scienceによる科学研究革新プログラム ( SPReAD ) 」の公募を開始しました。本事業は、あらゆる分野の研究者がAIを活用して科学研究の高度化・加速化を図れるよう、萌芽的・探索的な研究を支援するものです。1 課題あたり 500 万円以下の補助で計 1,000 件程度の採択が予定されており、計算資源やデータ整備、 API 利用料なども対象経費に含まれます。 AWS のクラウドサービスは、こうした研究に必要な計算基盤や AI サービスを柔軟に提供できる環境として、多くの研究者に活用されています。
AI for Science は将来的な可能性ではなく、すでに研究現場での活用が進みつつあるテーマとなっています。本記事では、各研究領域で具体的に何が起きているのかをユースケース中心にお伝えし、ご自身の研究に AI をどう取り入れるかを考えるきっかけとしていただければ幸いです。
1. タンパク質構造予測がノーベル賞を受賞した意味
〜 研究の現場で起きていること
2024 年、 AI を活用したタンパク質研究にノーベル化学賞が授与されました。AI モデルによるタンパク質の立体構造予測 – 分子生物学において「 50 年来の夢」と呼ばれてきた課題を、AIが解き明かしたのです。この出来事が示しているのは、AI が研究の効率化ツールにとどまらないということです。AI は、人間の研究者が数十年かけても到達できなかった科学的発見を、まったく新しいアプローチで実現する力を持っています。そしてこの力は、創薬、材料科学、ゲノミクス、気候科学、素粒子物理学といったあらゆる科学領域に広がり始めています。
すなわち、AI for Science が「使える技術」になったと考えています。背景として、3つの潮流があると考えています。
ひとつは、AI 自体の成熟です。基盤モデル、マルチモーダル学習 ( 画像、音、テキストなど異なる種類の情報をまとめて扱った学習 / モデル開発 ) 、エージェント AI などが、研究の現場で実用に耐えるレベルに達しました。2つ目は、フィジカル AI の台頭です。ロボットやセンサーに組み込まれた知能が、実験室の中で自律的に動作するようになりました。そして、3つ目ですが、クラウドコンピューティングの普及です。大規模なデータ処理、柔軟に拡張できる GPU 環境、国境を越えた共同研究基盤が、個々の研究室でも手の届くものになりました。
これら、6つの領域から事例をご紹介したいと思います。
1-1. 創薬:分子設計から臨床試験まで、パイプライン全体が変わる
創薬研究は、AI の恩恵を最も早く、最も深く受けている領域のひとつです。生成モデルを使った新規分子設計 ( de novo分子設計 ) では、特定の標的に最適化された新しい分子構造の候補を数時間で数千個生成できるようになりました。従来、化学者が経験と直感に頼って行っていた作業を、AIが広大な化学空間の中から最適解を探索する形で補っています。薬の体内での吸収・分布・代謝・排泄・毒性 ( ADMET )をパイプラインの早い段階で予測することで、後期臨床試験での失敗——最もコストのかかる失敗——を未然に防ぐアプローチも広がっています。
AI によるタンパク質と薬剤候補の結合予測は、両者がどれだけ強く結びつくかを高い精度で予測し、コンピュータ上で数十億の化合物を評価できます。実験室のリソースを、本当に有望な候補に集中させることが可能になるのです。
1-2. ゲノミクス:生命の設計図を読み解く
ゲノミクス分野では、ディープラーニングによる遺伝子配列の解析が、変異の特定やパターン認識を大幅に加速しています。AlphaFold に代表されるタンパク質構造予測モデルは、アミノ酸の配列情報から立体構造を予測し、構造に基づく創薬設計の新たな道を切り拓きました。
注目すべきは、複数の生体データを統合する「マルチオミクス」の進展です。遺伝子、RNA、タンパク質、代謝物のデータを組み合わせて解析することで、病気のメカニズムの全体像を捉えることが可能になりつつあります。個人の遺伝子情報に基づくオーダーメイド医療の構築も、概念実証の段階を超え、実用化に向けて動き出しています ( 出典:AWS ゲノミクスソリューション ) 。
1-3. 材料科学:試行錯誤から、AI による逆設計へ
新材料の発見は、従来の試行錯誤では膨大な時間とコストを要しました。AI はこのプロセスを根本から変えつつあります。広大な化学空間を効率的に探索し、安定性や効率性に優れた新材料の候補を見つけ出す。硬さ、導電性といった材料の性質を機械学習モデルで予測する。さらに、「こういう性質を持つ材料が欲しい」という要求から逆算して材料を設計する「逆設計」も実現しつつあります。
AI とロボティクスを組み合わせた自律実験室では、材料の合成から性能評価までを 24 時間体制で自動化し、実験にかかる時間を桁違いに短縮しています。
1-4. 化学:合成経路の自動設計と自律実験
化学の分野では、ディープラーニングが反応の結果、収率、条件の予測を高い精度で実現しています。複雑な分子の合成経路を自動設計する AI は、数百万の候補ステップの中から最も効率的なルートを見つけ出し、危険な中間体を避けながらコストと収率を最適化します。
産業向けの新しい触媒の設計も加速しており、AI モデルとロボットを組み合わせた自律実験室では、実験の設計から実行、結果の評価、次の実験計画までを人手を介さずに行えるようになっています。
1-5. 気候科学:地球規模の課題に AI で挑む
気候変動への対応は、科学研究の中でも最も緊急性の高いテーマです。AI技術による高解像度の気候モデルは、地球全体の気候予測を地域レベルに落とし込み、地域ごとの適応策の立案を支援します。衛星やセンサーのデータをディープラーニングで分析する極端気象の予測は、従来より早い段階で、より高い精度で警報を出せるようになっています。
CO2 の回収・貯留 ( CCS )では、AIが吸着材の設計や貯留場所のシミュレーションを最適化し、エネルギー消費の低減に貢献しています。大量の衛星画像をほぼリアルタイムで分析する技術は、森林破壊の監視、生物多様性の追跡、カーボンオフセットの検証といった用途に活用されています (出典:AWS 地球観測 ) 。
1-6. 物理学:量子シミュレーションから核融合制御まで
物理学の最前線でも、AIは欠かせない存在になりつつあります。AI を活用した量子シミュレーションは、従来のコンピュータでは困難だった計算のボトルネックを克服し、波動関数の計算や量子状態の予測を高速化しています。LHC などの高エネルギー物理実験では、ディープラーニングが膨大な衝突データから珍しい粒子の反応をリアルタイムで選び出しています。
特に注目されているのが、強化学習によるトカマク型核融合炉の制御です。磁気コイルをリアルタイムで制御してプラズマの安定性を保ち、装置の損傷につながる不安定現象を防止 – 核融合エネルギーの実用化に向けた重要な技術的進展です。
2. AWS を活用して AI for Science を実践している先駆者たちの研究事例
ここでは、AI for Science を実践している 4 つの先進事例を紹介します。それぞれの研究がなぜ重要なのか、そして AI がどのような役割を果たしているのかについて説明したいと思います。
2-1. Genomics England — AI で遺伝子診断の精度を高める
なぜ重要か:希少疾患の患者にとって、正確な遺伝子診断は治療への第一歩です。しかし、一人の患者あたり数百万に及ぶ遺伝子変異を評価し、膨大な科学論文から関連するエビデンスを見つけ出すことは、人間の力だけでは限界があります。
AI の役割:Genomics England は、AWS 上に構築した基盤で機械学習を活用した文献分析を導入しました。その結果、人間のキュレーターが見落としていたエビデンスが発見され、複数の遺伝子が新たに診断レベルに昇格しました。従来は何年もかかったであろう成果が、数か月で実現したのです ( 出典 : Genomics England AWSカスタマーストーリー、AWS AIブログ:ゲノミクス変異解釈の加速 ) 。
2-2. Allen Institute for Brain Science — 世界最大の脳地図をつくる
なぜ重要か:アルツハイマー病やパーキンソン病といった脳の病気を理解し治療するためには、まず脳そのものの構造を詳細に知る必要があります。Allen Instituteは、人間の脳全体を細胞レベルで地図化するという壮大なプロジェクトに取り組んでいます。
AIの役割:Allen Institute は、AWS 上に「Brain Knowledge Platform ( BKP ) 」を構築しました。高性能コンピューティングと生成AIを組み合わせることで、従来は数週間かかっていたデータ処理パイプラインを1日で実行できるようになり、扱えるデータセットの規模は1,000倍に拡大しました。世界中の 1,000 以上の研究機関がこのプラットフォームを通じてオープンデータにアクセスし、脳科学の発見を加速しています ( 出典:Allen Institute カスタマーストーリー、Allen Institute:ヒト脳マッピング、Allen Brain Observatory オープンデータセット ) 。
2-3. LILA Sciences — AI が仮説を立て、実験を実行する
なぜ重要か:科学研究のボトルネックのひとつは、仮説の立案から実験の設計・実行までに多くの時間と人手がかかることです。もし AI がこのプロセスを自律的に行えるようになれば、発見のスピードは飛躍的に向上します。
AIの役割:LILA Sciencesは「AI Science Factory」という新しい研究の仕組みを構築しています。AI が自ら仮説を提案し、実験を設計・実行する。大規模な推論処理をAWSの計算基盤上で実行し、発見の規模と速度を大幅に引き上げています。研究者がAIと協働して科学的発見を生み出す——その未来の姿を、今まさに体現しているプロジェクトです ( 出典 : LILA Sciences AWSカスタマーストーリー、LILA Sciences 紹介動画 ) 。
2-4. University of Arizona — 「1週間の調査が1回の検索に」
なぜ重要か:研究者にとって、自分の研究テーマに関連する知見や共同研究の相手を見つけることは、成果を左右する重要な活動です。しかし、膨大な論文や研究者情報の中から適切な情報を探し出すには、多大な時間がかかります。
AIの役割:University of Arizona が開発した「KMap」は、年間 41,000 人以上が利用するAI搭載の研究コラボレーション基盤です。大規模言語モデル ( LLM )が研究者の関心を自動的に把握し、質問に対してエビデンスに基づいた回答を返します。ある研究者は「1週間分の手動調査が1回の検索で済んだ」と語っています。分野を越えた共同研究チームの形成を促すこの仕組みは、AIがもたらすネットワーク効果の好例です ( 出典 : AWS パブリックセクター blog University of Arisona KMap ) 。
3. AWSが支えるAI for Scienceの技術基盤/サービス
ここまで紹介してきたユースケースや事例の多くは、AWS のクラウドインフラ上で実現されています。それは、AI for Science が求める「大規模な計算資源」「多様な基盤モデルへのアクセス」「研究データの安全な管理」「グローバルな共同研究基盤」のすべてを、AWS が包括的に提供しているからです。ここでは、前半で紹介した研究領域の具体的な課題と、それを解決する AWS サービスの対応関係を見ていきます。
3-1. 仮説生成・文献レビュー — Amazon Bedrock と基盤モデル
創薬研究者が数百万の論文から新たな標的を探索する、ゲノミクス研究者が複数の生体データの中からパターンを発見する——こうした仮説生成の場面で中核となるのがAmazon Bedrockです。Claude、Llama、Amazon Nova / Titanといった主要基盤モデルに単一のAPIからアクセスでき、サーバーレスで即座に利用を開始できます。Amazon Bedrock は東京リージョン ( ap-northeast-1 ) で利用可能なため、研究データを国内に保持したまま基盤モデルを活用できます。Genomics England が膨大な論文の壁を突破した文献分析も、こうした基盤モデルの推論能力があってこそ実現しました。
さらに、Amazon SageMaker AI によるファインチューニングや継続的事前学習を通じて、特定の研究領域に特化したモデルを構築することも可能です。たとえば、化学反応の収率予測や材料特性の予測といった専門的な課題では、汎用モデルでは捉えきれない知見を自分たちの実験データで引き出すことが、研究の差別化につながります。
3-2. 実験設計・シミュレーション — HPC と AI コンピュート
材料科学の逆設計、気候モデルの高解像度化、量子シミュレーション、核融合炉のプラズマ制御——これらはいずれも膨大な計算資源を必要とします。AWS TrainiumとInferentia チップによる高性能な学習・推論インフラは、大規模モデルの開発と実行を高速・低コストで支えます。NVIDIA H100 GPU クラスタとElastic Fabric Adapter ( EFA ) による密結合 HPC クラスタは、分子動力学シミュレーションや気候モデリングといった計算集約型の研究に対応します。
Allen Institute が AWS 上で Brain Knowledge Platform を構築し、データ処理を数週間から1日に短縮できたのも、このスケーラブルな HPC インフラがあったからです。LILA Sciences が大規模な推論処理を実行する「AI Science Factory」も、AWS の計算基盤上で稼働しています。Amazon SageMaker HyperPodを使えば、大規模モデルのゼロからの学習も、インフラ管理の負担なく実行できます。
3-3. 科学文書インテリジェンス — 眠っているデータの活用
研究機関に眠る膨大な非構造化データ——論文、ラボノート、実験記録——を活用するための技術も、AWS の強みです。Amazon Textractはスキャンされた科学文書からテキスト、手書き文字、表データを自動で読み取り、研究論文特有の複雑なレイアウトにも対応します。Amazon Comprehendのカスタムエンティティ認識を活用すれば、化学物質名、タンパク質、投与量といった科学用語の認識や関係性の抽出を行えます。
これらを統合的な知識基盤として構築し、RAG ( 検索拡張生成 ) と組み合わせれば、数百万の文書を横断的に検索し、出典付きのエビデンスに基づいた回答を得ることが可能です。アリゾナ大学の KMap が「1週間分の手動調査を1回の検索に」短縮できたのは、まさにこの RAG の実践例です。
助成金申請の効率化に向けては、AWS とノースカロライナ大学の研究者が共同で開発したプロトタイプ「GROW ( Grant Writing Opportunity Wizard ) 」が注目されています。Amazon Bedrockのエージェント技術を活用し、研究者の専門性と利用可能な助成金を自動的にマッチングする仕組みで、GitHubでオープンソースとして公開されています。研究者が業務時間の42%を費やしているとされる事務作業 ( 出典:FDP Faculty Burden Survey ) の負担を軽減する取り組みとして、今後の発展が期待されます。
3-4. データ基盤 — 研究データを戦略的な資産に
AI for Science の成功は、データ基盤の質にかかっています。Amazon S3を中核としたストレージ基盤は、ゲノミクスの大規模な配列データから、気候科学の衛星画像、化学の分光データまで、あらゆる研究データを安全かつ柔軟に管理します。AWS Glue Data Catalogによるデータの整理、Amazon Athenaによるサーバーレスでの検索、Amazon Quickによる可視化まで、一貫した基盤上でデータの価値を引き出せます。Amazon Quickも東京リージョンで利用可能なため、研究データを国内に保持したまま分析・可視化を行うことができます。
Open Data on AWSでは、300PB 以上の公開データセット——1000 Genomes Project、The Cancer Genome Atlas、Landsat 8、SpaceNetなど——に無料でアクセスできます。創薬研究者がゲノムデータベースを参照する、気候科学者が衛星画像を分析する、材料科学者が結晶構造データを探索する——いずれの場面でも、データ取得のコストと時間を削減し、分析そのものに集中できる環境です。
3-5. データセキュリティと知的財産の保護
研究データの保護は、AI for Science において最も重要な課題のひとつです。特に創薬研究における分子構造データや、ゲノミクスにおける患者由来データなど、知的財産や個人情報を含むデータを扱う場面では、セキュリティへの信頼が欠かせません。
ここで明確にしておくべきことがあります。Amazon Bedrockでは、お客様のデータは基盤モデルの学習に一切使用しません。また、Anthropic等のサードパーティのモデルプロバイダーを利用した場合においても、モデルプロバイダーにデータは共有されません。データはAWS Key Management Service ( KMS ) による保存時暗号化とTLS 1.2+による転送時暗号化で保護され、IAM によるきめ細かなアクセス制御が可能です。AWS PrivateLink を使えば、パブリックインターネットを経由せずにプライベート接続できます。そして、多くのAWSサービスにおいて、国内にデータを保持することが可能です。
3-6. AIの倫理とガバナンス
AI for Scienceの推進にあたっては、技術的な能力だけでなく、AIの倫理的な利用とガバナンスの確保も重要です。研究の再現性、データの公正な取り扱い、AIが出す結果の説明可能性——これらは科学研究の信頼性を支える基盤です。
AWSは、制御可能性、プライバシーとセキュリティ、安全性、公平性、正確性と堅牢性、説明可能性、透明性、ガバナンスという8つの観点からなる責任あるAIフレームワークを提供しています。Amazon Bedrock Guardrails による不適切な出力の防止や、AWS CloudTrail による詳細な操作ログの記録を活用することで、研究の科学的厳密性を守りながらAIを活用するための仕組みが整っています。知的財産の漏洩リスクを心配することなく、安心してAIを研究に取り入れることができます。
4. 始めるなら、今
AI for Science の導入は、大きな投資や大がかりな体制づくりから始める必要はありません。
まず、ご自身の研究の中で、AI が役立ちそうな場面を見つけてください。文献レビューの効率化、繰り返しの多い分析作業の自動化、候補物質の絞り込みの高速化など、AIによって研究が具体的に前進する課題はどこにあるでしょうか。
次に、今の研究環境を振り返ってみましょう。手元のデータは十分に整理されているか、チームにはどのような知識や経験が足りないか。この振り返りが、具体的な計画を立てる出発点になります。
そして、小さく始めてください。8〜12 週間ほどの短期間で、テーマを絞った試験的な取り組み ( PoC )を行い、AI が実際に役立つかどうかを確かめます。AWSのマネージドサービスを活用すれば、インフラの構築や運用にかかる手間を最小限に抑えられます。手応えが得られたら、運用ルールや評価指標を整えながら、段階的に活用の範囲を広げていきましょう。
AWS では、研究者の方々が AI for Science を始めるための具体的な支援を用意しています。
- 短時間の相談会:研究の進め方を整理し、AIが活用できそうなテーマを一緒に特定します
- 導入支援サポート:文献検索の自動化や実験プロトコルの生成など、具体的なテーマで技術的な実現可能性を検証します。経験豊富なパートナーも紹介できます
- 生成AIイノベーションセンター:1億ドルの投資に裏打ちされた専門チームが、モデルの選定や研究への適用方法について助言します
- 文部科学省 SPReAD事業への応募に関する支援:計算資源やAPI利用料も対象経費に含まれており、AWSのクラウドサービスの利用費用も申請可能です。第1回公募は2026 年 5 月 18 日 ( 月 ) 正午締切です ( 第 2 回は 6 月上旬予定 )
ご関心をお持ちの方は、AWSの担当チームまでお気軽にお問い合わせください。
次の科学的ブレークスルーは、AIとの協働から生まれます。
アマゾン ウェブ サービス ジャパン合同会社
執行役員 パブリックセクター技術統括本部長
瀧澤 与一 / Yoichi Takizawa