Amazon Web Services ブログ

AWS Summit Japan 2024 ヘルスケア・ライフサイエンス 展示ブース 開催報告

国内最大規模の学習型ITカンファレンスである AWS Summit Japan が、6 月 20 日(木)、21 日(金)の二日間に渡り幕張メッセで開催されました。今年は昨年よりもブース展示が拡充され、ヘルスケア・ライフサイエンス(HCLS)ブースでは、大きく製薬、ゲノミクス、医療業界の 3 つのカテゴリーに沿って展示を行い、お陰様で大勢のお客様にご来場いただきました。展示内容としては、お客様の大きな関心事である生成AIを活用した業務効率化、自動化に加えて、業界特化型サービスである AWS HealthOmics や医用画像管理ソリューションなどを盛り込んだ最新デモをご紹介しました。

展示したデモ内容

製薬業界向けソリューション(臨床以外の事業領域でも生成AI活用をご支援いたします)
①生成AIを活用した臨床開発におけるプロトコルのドラフト作成支援 – 先行研究調査
②生成AIを活用した臨床開発におけるプロトコルのドラフト作成支援 – 対象集団デザイン

ゲノミクスユースケース向けソリューション
③解析ワークフローの便利な実行
④オミクスデータの分析
⑤ワークフローの開発

医療業界向けソリューション
⑥医用画像管理とDICOMwebアクセスによるデータ二次利用
⑦生成AIを活用した電子カルテ情報から退院サマリー作成

以下のセクションより、各ソリューションの詳細を説明します。

製薬業界向けソリューション:製薬向け生成 AI (創薬/臨床開発/製造) [Slide]

製薬向け生成 AI ブースでは、Amazon Bedrock を利用した、製薬企業における各業務に⽣成AIを組み込むことでプロセスの短縮、効率化および新たなインサイトの抽出することをイメージしていただくためのデモを展示しました。

ヘルスケア・ライフサイエンス領域は、生成 AI の活用が最も期待される領域の一つであり、研究開発、臨床開発、製造からマーケティング・営業まで様々な業務部門で高いビジネス効果が期待されています。詳細は、次のAWSブログを参照ください。生成系 AI が拓くイノベーション:大規模言語モデル (LLM) を活用した製薬企業の業務改善Part 1, Part 2, Part 3 。一方で、製薬企業における各業務は非常に専門性が高く、基盤モデル (FM) を単純なチャットボットや RAG (Retrieval Augmented Generation) と呼ばれる手法に応用しただけではビジネス効果を期待できないケースがあります。そのため、基盤モデルの特性をよく理解した上で、各業務のプロセス全体を俯瞰し、組み合わせるデータを検討した上でアプリケーションのアーキテクチャおよびそれを組み込んだ業務プロセスを模索する必要があります。一方で、特に普段データ分析やアプリケーション開発を専門としない業務部門にとっては、業務プロセスに基盤モデルを組み込んだアプリケーションを素早く作成し、業務に適用して改善のループを迅速に回すことに課題がありました。そこで、製薬企業における基盤モデルを組み込んだ業務デザイン素早く検証するための様々なユースケースのプロトタイピング実装が Generative AI Starter Apps for Pharma Workload (GASA for Pharma) です。

GASA for Pharma では、現在は主に臨床開発のユースケースを中心に、各業務プロセスに合わせて基盤モデルを活用したプロセスの短縮、効率化および新たなインサイトの抽出を体感いただけるシナリオを実装しています。これらのユースケースを実際に触っていただくことで、基盤モデルをどのように皆さんの業務に活用するかを具体的に想像していただけることを期待しています。また、各ユースケースのバックエンドのロジックはAmazon Bedrockの基盤モデルを呼び出す形でAWS Lambda の関数やAWS Step Functions のワークフローとして実装されているため、この実装を参考に素早く皆さんの業務やデータに合わせたシナリオを検証することが可能です。

今回のAWS Summit Japan 2024では、GASA for Pharma に現在実装されている、臨床開発向けの2つのユースケースを中心に紹介しました。

①臨床開発におけるプロトコルのドラフト作成支援 – 先行研究調査

1つ目のユースケースは、クリニカルサイエンスや臨床開発のPMロールといった方々が横断的な先行研究調査を行うシナリオを想定したもので、基盤モデルによるクエリ生成や文章要約により、幅広い情報を素早く収集して可視化するデモとなっています。このデモでは、臨床開発の方々が慣れ親しんだ自然言語のフォーマットで調べたい先行研究の情報を入力すると、臨床研究のオンラインデータベースである ClinicalTrials.gov から情報を取得し、ビジュアルを含む全体の要約や各 Study の要約、および元となったデータソースへのリンクを確認することができます。

②臨床開発におけるプロトコルのドラフト作成支援 – 対象集団デザイン

2つ目のユースケースは臨床試験の対象集団をデザインするために必要な情報を収集シナリオを想定したものです。データソースは1つ目のユースケースと同様 ClinicalTrials.gov ですが、違いはデータの深掘りをテーマとしている点です。このデモでは、入力するフォーマットは1つ目のユースケースと同様ですが、出力には Inclusion Criteria, Exclusion Criteria, Publication の情報のサマリーをすることで、必要な情報を素早く確認することができます。また、要約された各 Study から関心のあるものを選択することで、それらの複数の Study の横断的な要約を生成して確認することができます。このように人間の判断を介在させる Human-in-the-Loop と呼ばれる手法は機械学習モデルの業務活用において重要な考え方ですが、このデモでは基盤モデルを駆使した検索および要約生成に活用するケースを体感いただくことができます。

ゲノミクスユースケース向けソリューション:臨床/研究者のマルチオミクス解析の⾃動化 [Slide]

AWS HealthOmics は、ヘルスケア・ライフサイエンス領域のお客様をご支援する業界特化型のサービスで、2022年末の re:invent で発表されました。AWS HealthOmics を利用することで、ゲノムデータ、トランスクリプトームデータ、その他のオミクスデータを保存、検索、分析し、そのデータから健康の改善と科学的発見の促進につながるインサイトを生み出すことに役立てることが可能です。

今回のデモは AWS HealthOmics を軸に以下 3 つの要素から構成されています: ③解析ワークフローの便利な実行④オミクスデータの分析⑤ワークフローの開発。③に関しては AWS に詳しくない方でも HealthOmics ワークフローをより簡単に操作することが可能な Web アプリを、④に関しては HealthOmics Analytics に取り込んだバリアント・アノテーションデータを Amazon SageMaker ノートブックAmazon QuickSight を使って可視化や分析を行うデモをご紹介しました。また今回のデモは昨年の AWS Summit におけるデモを拡張したコンテンツとなっているため、本記事では新しいコンテンツの 3 点についてご説明します。

まずワークフロー実行(③)に関するアップデートとして、リリース当初の AWS HealthOmics ワークフローはユーザーがワークフローの定義をアップロードして実行する形式(プライベートワークフロー)のみのサポートでしたが、事前定義済みのワークフローからすぐに解析を開始できる Ready2Run ワークフローという選択肢が追加されました。Sentieon、NVIDIA Parabricks、Element Biosciences といったパートナー各社のパイプラインに加え、GATK ベストプラクティス、nf-core scRNAseq、タンパク質予測のための AlphaFold や ESMFold を含むオープンソースパイプラインを含め、現在 36 種類のパイプラインが利用可能です。こちらの機能は前述の WebApp からも既に利用可能です。

また、ワークフロー実行(③)を自動化するという観点のデモをご紹介しました。内容としては、シーケンスデータが Amazon Simple Storage Service (Amazon S3) にアップロードされたことをトリガーにして、Ready2Run ワークフローの GATK BP Fastq2Vcf が実行され、さらにそちらが完了するとプライベートワークフローとして定義された Variant Effect Predictor (VEP) ワークフローが実行され、最終的に結果ファイルが Amazon S3 に出力されます。こちらは過去のブログの内容を元に作成されたものであり、自動実行を実現するサンプルコードが Github 上でも公開されています。

最後に、ワークフローの開発フェーズ(⑤)における AWS Step Functions 活用についてのデモです。背景として、オミクス解析のワークフローは複数の「タスク」から構成されており、実行に時間がかかることも多いため、例えば最後の部分でエラーが出た場合でも最初からやり直しが必要になってしまうといった開発面での課題があります。今回はデモを通して、この課題への対処として AWS Step Functions を利用するアプローチを紹介しておりました。AWS Step Functions はデベロッパーが AWS のサービスを利用して様々なデータを扱うパイプラインを構築できるようにするビジュアルワークフローサービスです。全体のワークフローの中の、特定のタスクのみを実行できることや(TestState)、途中失敗したタスクからの再実行(RedrivingExecution)といった機能を持っているため、上述した課題を解決しながらワークフロー開発でお役立ていただけるのではないかと考えています。

医療業界向けソリューション:医療機関向けHealthAI (医用画像管理/文書生成) [Slide]

⑥医用画像管理と DICOMweb アクセスによるデータ二次利用

医用画像管理において、画像の解像度の向上や画像枚数の増加によるストレージ容量の不足やサーバのスケーリングにおける課題解決のためにクラウド活用が進むと予想されます。その時にどのような AWS サービスを組み合わせて画像サーバを構築することができるのか、実際に動くソリューションを紹介しました。

医用画像は放射線画像や病理画像ともに国際標準である DICOM(Digital Imaging and Communications in Medicine)という国際標準に基づいて、ファイル形式や通信プロトコルが定められています。DICOM の特徴はピクセルデータ(画像)だけではなく、患者情報や検査情報といった文字情報を含めて、1つのファイルになっていることです。オープンソースの Orthanc は DICOM に準拠したサーバーソフトウェアです。Orthanc では、その DICOM ファイルを取り込み、タグの文字情報を検索可能なデータベースに、画像ファイルはストレージに保管します。

通常、検査種や検査数に応じて、画像の占有サイズからストレージ容量を見積ったり、データベースもレプリケーション(複製)やバックアップを取ったり、要求に対応したアプリケーションのスケーリングも必要になりますが、 Amazon S3 や Amazon RDSAWS Fargate といったマネージドなサービスをインフラとして、 DICOM の規格に準拠した画像サーバをクラウドで構築できます。その環境構築をスクリプトで実行する AWS CDK を用いた Orthanc CDK Deployment をお使いいただけます。ブースでは同じくオープンソースの DICOM Viewer である Stone Viewer で放射線画像を、 WSI Viewer で病理画像をブラウザでの表示するデモを展示しました。

今回のデモにより、既存の撮影装置やアプリケーションで採用されている DICOM 標準の用画像サーバを AWS インフラで稼働させ、ウェブブラウザから画像を検索し参照するイメージを掴んでいただけたと思います。ウェブ経由で画像をアクセスできる DICOMweb は主要なプログラミング言語から利用可能な REST API を採用しているので、 Python で医用画像を機械学習に活用やスマホアプリやウェブアプリなど、様々なユースケースでお使いいただけます。会場では増え続ける医用画像の無制限のストレージやデータベースのバックアップや運用でお困りのお客様からは強い関心をもっていただきました。

⑦生成AIを活用した電子カルテ情報から退院サマリー作成

退院サマリーは入院患者が病院を退院する時に作成される、病歴や身体所見、検査所見や入院中の医療内容(検査、投薬、治療等)の記録で、退院後の他の診療科や医療機関への外来診療などで治療を継続できるために医師の責任で書かれる文書です。その記録のために、患者に関連する電子カルテや部門システムの情報にアクセスし、決められた形式で担当医師が書くことにかなりの労力と時間がかかっています。その課題を解決するために、生成AIのサービスである Amazon Bedrock と Anthoropic Claude (最新の3.5を含む)による退院サマリー生成アシスタントのプロトタイプを開発しました。

患者 ID を入力し、医師記録や看護記録といったシステムが持っている患者に関する情報を横断的に収集し、膨大な情報を元に、退院サマリーとして求められる病歴や治療経過などを定型のフォーマットで生成することができます。 Prompt engineering で GenAI が推測文書を書くことを抑止し、各システムが持つ記録のみに基づいて、文書が生成されるようにしています。医師はこのアシスタントにより、収集された一次データを確認しつつ、生成された退院サマリーの雛形を手直しすることで、ゼロから退院サマリーを書くよりも、時間を患者のために有効に使うことができるようになります。プロトタイプについて関心を持たれたら、 弊社営業担当もしくはAWS 問い合わせ窓口へお問い合わせください。

著者について

Yuhei Harada

原田 裕平 (Yuhei Harada) エンタープライズ技術本部 ヘルスケア&ライフサイエンス部 ソリューションアーキテクト: AWSでは主にヘルスケア・ライフサイエンス業界のお客様を支援をしているソリューションアーキテクトです。

Yusuke Toba

鳥羽 祐輔 (Yusuke Toba) エンタープライズ技術本部 ヘルスケア&ライフサイエンス部 ソリューションアーキテクト: 現在はライフサイエンスのお客様向けにクラウド活用に関する技術的なご支援を行っています。またバイオインフォマティクスやゲノミクスの領域でクラウドを活用いただくことでお客様の研究活動・ビジネスを加速させることに興味があり、AWS HealthOmics をはじめとする AWS ソリューションのご提案や技術支援を行っています。

Hiroyuki Kubota

窪田 寛之 (Hiroyuki Kubota) エネルギー・ヘルスケアライフサイエンスソリューション部 ソリューションアーキテクト: HL7やDICOMの標準化活動の経験から、医療情報・医用画像を扱うお客様のクラウド利用に関する技術支援をしています。最近は新しい医療データ標準のHL7 FHIRを格納するAmazon HealthLakeなどを提案しています。

Yuto Kataoka

片岡 勇人 (Yuto Kataoka) ヘルスケア・ライフサイエンス事業開発部 シニア事業開発マネージャー: クラウドに対する日本のお客様固有の要件にお応えするために、AWS グローバルチームとも連携し、ヘルスケア・ライフサイエンス領域のお客様の取組みをご支援しております。