Amazon Web Services ブログ
ページングドクタークラウド! Amazon HealthLake が一般公開されました
AWS re: Invent 2020 ではAmazon HealthLake をプレビューしました。これは、フルマネージドの HIPAA 対応サービスです。さまざまなサイロやフォーマットで存在するヘルスケア及びライフサイエンスのお客様の健康情報を、構造化され一元化された AWS データレイクに集約します。分析と機械学習 (ML) を使用してそのデータからインサイト抽出を行います。今日、Amazon HealthLake が、 AWS のすべてのお客様にご利用いただけるようになったことをお知らせすることができて大変嬉しく思います。
医療データを迅速かつあらゆるスケールで保存、変換、分析する機能は、健康に関する質の高い意思決定に不可欠です。医師は日々の診療で、最善の対応を特定するために、患者の完全に時系列に沿った病歴を必要とします。緊急時には、医療チームに適切なタイミングで適切な情報を提供することで、患者の転帰を大幅に改善できます。同様に、集団の健康傾向や薬物治験対象者を特定するため、ヘルスケアやライフサイエンスの研究者にはモデルを分析・構築できる、質の高い標準化されたデータが必要です。
従来、ほとんどの医療データは、臨床メモなどの構造化されていないテキストに限定され、IT サイロに保存されてきました。異種混在のアプリケーション、インフラストラクチャおよびデータのフォーマットのせいで、医師が患者のデータにアクセスしインサイトを抽出することが困難な状態でした。その問題を解決するために Amazon HealthLake を構築しました。
今すぐ使ってみたい場合は、Amazon HealthLake の AWS コンソールに今すぐジャンプできます。さらに詳しく知りたい方は、このままお付き合いください。
Amazon HealthLake の紹介
Amazon HealthLake は、完全マネージド型の AWS インフラストラクチャに支えられています。単一の IT 機器の調達、提供、管理をする必要は全くありません。たった数分で新しいデータストアを作成するだけです。データストアの準備ができたら、すぐにデータの作成、読み取り、更新、削除、およびクエリが実行できます。 HealthLake は、最も一般的な言語 で利用できるシンプルな REST アプリケーションプログラミングインターフェイス (API) を公開しており、お客様やパートナーは簡単に自分のビジネスアプリケーションに統合することができます。
AWS ではセキュリティはジョブゼロ、大前提です。デフォルトでは、 HealthLake は AWS Key Management Service (KMS) を使用して保管中のデータを暗号化します。AWS 管理キーまたは独自のキーを使用できます。KMS は、AWS の従業員を含む誰もサービスからプレーンテキストキーを取得できないように設計されています。転送中のデータについては、HealthLake は業界標準の TLS 1.2 暗号化をエンドツーエンドで使用します。
HealthLake は、起動時に、臨床ノート、ラボレポート、保険請求書類などにある構造化テキストデータと非構造化テキストデータの両方をサポートします。当サービスでは、このデータを医療データの交換を可能にするために設計されたスタンダードフォーマットである高速医療相互運用性リソース (Fast Healthcare Interoperability Resource:FHIR「読み方:ファイア」) で保存します。HealthLake は最新のリビジョン (R4) と互換性があり、現在 71 の FHIR リソースタイプをサポートしており、追加のリソースもサポートしていきます。
お客様のデータが既に FHIR フォーマットになら最高です! そうでない場合は、お客様自身で変換するか、 AWS Marketplace で利用できるパートナーソリューションに頼ることも可能です。 HealthLake には起動時から、 Redox、HealthLX、Diameter Health、およびInterSystemsのアプリケーション用の検証済みコネクタが含まれています。これらは HL7v2、CCDA、およびフラットファイルのデータを FHIR に変換しHealthLake にアップロードすることを容易にします。
データがアップロードされると、 HealthLake は統合された自然言語処理を使用してドキュメントに存在するエンティティを抽出し、対応するメタデータを保存します。これらのエンティティには、生体構造、病状、投薬、保護された健康情報、検査、治療、および処置が含まれます。これらはまた、業界スタンダードの ICD-10-CM および RxNorm エンティティにも適合します。
データをアップロードしたら、FHIR リソースと抽出されたエンティティにパラメータ値を割り当てて、データのクエリを開始できます。1 人の患者の情報にアクセスする必要がある場合でも、研究データセットを構築するために多数のドキュメントをエクスポートしたい場合でも、1 回の API コールだけで済みます。
簡単なデモを見てみましょう。
Amazon HealthLake で FHIR データをクエリする
HealthLake の AWS コンソールを開き、[データストアを作成] をクリックします。次に、データストアの名前を選択し、AWS マネージドキーで暗号化することにします。また、サンプル合成データをプリロードするボックスにチェックを入れます。これによって自分のデータをアップロードすることなく、サービスをざっと試してみることが出来ます。
数分後、データストアがアクティブになり、HTTPS エンドポイントにクエリを送信できます。以下の例では、信頼スコア 99% 以上の「高血圧」の ICD-CM-10 エンティティを含む臨床ノート限定で探します。内部では、AWS コンソールはエンドポイントに HTTP GET リクエストを送信しています。対応するクエリ文字列をハイライト表示しました。
クエリは数秒で実行されます。ブラウザで JSON レスポンスを調べると、2 つのドキュメントが含まれていることがわかります。それぞれについて、いつ作成されたか、所有している組織、作成者が誰であるかなど、多くの情報を見ることができます。HealthLake が、名前、説明、信頼度スコアを含むエンティティの長いリストを自動的に抽出し、ドキュメントに追加したことも確認できます。
ドキュメントは base64 フォーマットでレスポンスに添付されます。
文字列をテキストファイルに保存し、コマンドラインツールでデコードすると、次のように表示されます。
ネッセル氏は 52 歳の白人男性で、冠動脈疾患、心房細動、高血圧、高脂血症を含む広範な病歴を持ち、悪寒、吐き気、急性左脇腹痛、左脚のしびれなどの症状を訴えノース ED に来院しました。
このドキュメントは正にその通りです。ご覧のとおり、Amazon HealthLake に保存されているデータのクエリと取得は非常に簡単です。
Amazon HealthLake に保存されているデータの分析
HealthLakeから データをエクスポートし、Amazon Simple Storage Service (Amazon S3) バケットに保存し、分析や 機械学習のタスクに使用できます。例えば、AWS Glue を使用してデータを変換し、 Amazon Athena でクエリを実行し、 Amazon QuickSight で視覚化できます。このデータを使用して、 Amazon SageMaker で 機械学習モデルを構築、トレーニング、デプロイすることもできます。
次のブログ記事は、HealthLake に保存されたデータに基づくエンドツーエンドの分析と 機械学習 ワークフローを示しています。
- Amazon HealthLake を使用した集団ヘルスアプリケーション:Amazon QuickSight を使用した分析とモニタリング
- Amazon HealthLake 正規化データを使用した Amazon SageMaker を使用した予知疾患モデルの構築
- Amazon HealthLake と Amazon SageMaker を使用して患者の転帰予測アプリケーションを構築する
- AWS AI サービスを使用してコグニティブ検索と健康知識グラフを構築する
最後に、この自習型ワークショップでは、 HealthLake を使用してデータをインポートおよびエクスポートし、AWS GlueとAmazon Athena で処理する方法と、 Amazon QuickSight ダッシュボード構築のやり方をお見せします。
それでは、HealthLakeでお客様が何を構築しているかを見てみましょう。
お客様は既に Amazon HealthLake を使用しています。
シカゴのラッシュ大学メディカルセンターは、HealthLakeを早くから採用しています。同センターではシカゴ公衆衛生局に代わって公衆衛生分析プラットフォームの構築に使用されました。このプラットフォームは、治療を受けている COVID-19 患者の入院、退院および移転、電子ラボ報告、受け入れ可能な病床数、および臨床ケア文書に関連するシカゴ全土の病院データを集計、組み合わせ、分析します。シカゴの 32 病院のうち 17 病院が現在データを提出しており、ラッシュ大学は今夏までに 32 病院すべてを統合する計画です。詳細についてはこのブログ記事をご覧ください。
最近、ラッシュ大学は、高血圧のリスクが最も高いコミュニティを特定し、健康上の社会的決定要因の理解を深め、医療へのアクセスを改善するための別のプロジェクトを開始しました。この目的のために、コミュニティでの臨床ノート、24 時間自由行動下血圧測定、メディケアの請求データなど、あらゆる種類のデータを収集しています。このデータはHealthLake に取り込まれ、さらなる分析のために FHIR 形式で保存されます。
博士は言います。ラッシュ大学メディカルセンターの副所長兼分析最高責任者、Bala Hota 氏:「無関係なアイテムの構築や、既に存在するものを再発明するのに時間を費やす必要はありません。これにより、分析フェーズにすばやく移行することができます。Amazon HealthLake は、人々に成果をもたらすために必要なインサイトを本当に加速させます。インフラストラクチャの構築に全部の時間を費やしたくありません。インサイトを提供したいのです。」
Cortica は、自閉症やその他の発達障害を持つ子供の医療に革命を起こすことを使命としています。現在、Cortica は HealthLake を使用して、すべての患者データを標準化し、安全かつ準拠した方法で保存しています。そのデータで ML モデルを構築することで、センチメント分析で患者の進行状況を追跡し、子ども発音発達と運動能力について進捗状況を保護者と共有できます。Cortica は、治療モデルの有効性を検証し、薬物療法を最適化することもできます。
Cortica のエンタープライズアプリケーションおよびデータ部門長、 Ernesto DiMarino 氏 Ernesto DiMarino は次のように語っています。「私達は Amazon HealthLake のおかげで、数カ月ではなくたった数週間で、患者の病歴、投薬歴、行動評価、ラボレポートを安全に保管する一元化されたプラットフォームを作成できました。このプラットフォームは私たち臨床チームに、患者のケアの進行状況についてより深いインサイトを提供してくれます。Amazon SageMaker の事前定義されたノートブックを Amazon HealthLake のデータとともに使用することで、機械学習モデルを適用して、他の方法ではできないやり方で、各患者の治療目標への進行を追跡、予見することができます。この技術を通じて、HIPAA 準拠のデータを患者、研究者、医療パートナーと相互運用可能な方法で共有し、自閉症治療に関する重要な研究を進めることができます。」
MEDHOST は、あらゆる種類と規模の 1,000 以上の医療施設に製品とサービスを提供しています。これらのお客様は、患者データを FHIR 形式で標準化し、患者ケアを改善するためのダッシュボードとアドバンスト分析を構築するためのソリューションを開発したいと考えていますが、現状では困難で時間がかかります。
Pandian Velayutham Sr.氏は言います。MEDHOST のエンジニアリングディレクター:「Amazon HealthLake では、病院の運営効率の向上とより良い患者ケアを提供したいというニーズを満たすため、数週間ではなくたった数日で、統合された自然言語処理と分析を用いた FHIR データストアを作成することができます。」
開始方法
Amazon HealthLake は現在、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)の リージョンでご利用頂けます。
自習のワークショップを試してご感想をお聞かせください。いつも皆様からのフィードバックをお待ちしています。通常の AWS Support の連絡先までお寄せいただくか、AWS フォーラムから送信していただくことができます。