AstraZeneca のゲノミクスデータ処理ソリューションが AWS において 1 日で 510 億のテストを実行

2021 年

最初のヒトゲノムが発表されてから約 20 年が経過した今、ゲノミクスは、研究中心の慣行から個別化医療の推進要因へと変化しつつあります。この移行に取り組んでいる世界的なバイオ医薬品企業である AstraZeneca は、精密医療におけるゲノミクスの利用を加速し、創薬を変革するためのゲノミクスの解析をさらに進めています。

AstraZeneca は、ペタバイト規模のゲノム配列決定データを利用して、医薬品の研究開発がより多くの情報に基づいたものとなるようにしています。大規模なデータを迅速に処理するために、AstraZeneca はアマゾン ウェブ サービス (AWS) を利用して、大きな影響をもたらす、ゲノミクスに関するインサイトを抽出するための高速で効率的なソリューションを構築しました。

AstraZeneca Genomics on AWS: A Journey from Petabytes to New Medicines (AWS での AstraZeneca ゲノミクス: ペタバイト規模のデータから新薬への道のり) (1:19)
kr_quotemark

これらの機能を用いて、2020 年の AstraZeneca の創薬プロジェクトのうち 40 件超に遺伝学的なインプットを提供しました」

Slavé Petrovski 氏
AstraZeneca、R&D、ゲノミクス研究センター、ゲノム解析およびインフォマティクス責任者、VP

科学者がイノベーションを実現するソリューションを構築する

AstraZeneca は、ゲノムデータからインサイトをすばやく収集することに加えて、リソースを科学的探索のために再割り当てし、比較的価値の低いデータ管理業務の実行にバイオインフォマティクスの時間を費やさないようにしたいと考えていました。同社は複数のソースを通じてペタバイト規模のデータを大量に収集するため、強力でスケーラブルなコンピューティング性能を必要としていました。

以前に AWS を基盤として構築したことがある AstraZeneca は、AWS ツールの利用を拡大して、迅速なゲノム処理と解析のためのクラウドベースのバイオインフォマティクスソリューションを開発することを決定しました。

AWS で自動化して高速インサイトを生成する

AstraZeneca のハイスループットソリューションは、ゲノムデータの処理と解析の多くのステップを実行します。ゲノム二次解析では、生データの配列決定リードを調べてゲノムを再構築し、後の段階でさらに解析できるゲノムバリアントを特定します。これらのステップのデータオーケストレーションを自動化するために、アーキテクチャは AWS Lambda を利用します。これは、サーバーをプロビジョニングまたは管理することなく、ユーザーがコードを実行できるサーバーレスコンピューティングサービスです。タスク実行レイヤーを構築するために、アーキテクチャは AWS Batch を利用します。AWS Batch では、コンピューティングリソース (CPU やメモリ最適化インスタンスなど) の最適な数量とタイプを、送信されたバッチジョブの量と具体的なリソース要件に基づいて動的にプロビジョニングします。その過程で、アーキテクチャは、オブジェクトストレージサービスである Amazon Simple Storage Service (Amazon S3) を利用してデータをバケットに分類します。

AstraZeneca は、AWS において、スケール、計算能力、および豊富なテクノロジーサービスへのアクセスを利用して、速度と生産性を向上させました。会社は必要に応じて解析を大規模に実行できるため、データをより早く解析に利用できます。「当社では、24 時間以内に 510 億を超える統計テストを実行し、それぞれが幅広い表現型を持つ個々の突然変異または個々の遺伝子の影響を研究できるようになりました」と AstraZeneca のゲノミクス研究センターのゲノム解析およびインフォマティクス責任者兼 VP である Slavé Petrovski 氏は述べています。会社の努力は報われています。「これらの機能を用いて、2020 年の AstraZeneca の創薬プロジェクトのうち 40 件超に遺伝学的なインプットを提供しました」と Petrovski 氏は述べています。

科学的なイノベーションを促進する

AstraZeneca は、迅速かつ効率的なゲノミクスバイオインフォマティクスパイプラインを作成しました。これは、科学者にイノベーションを追求するための時間とリソースをもたらしてくれます。その結果、同社のゲノミクス研究センターは、2026 年までに 200 万のゲノムを解析するという目標に向かって前進しています。


AstraZeneca について

AstraZeneca は、さまざまな治療分野で革新的な医薬品を開発している世界的なバイオ医薬品企業です。ゲノミクス研究センターは、2026 年までに 200 万のゲノムを解析することを目指す AstraZeneca のイニシアティブです。

AWS のメリット

  • 24 時間以内に 510 億を超える統計テストの実行をサポート
  • 2020 年に 40 を超える創薬プロジェクトに対して、ゲノムに関するインサイトの提供を促進
  • ゲノム配列決定に関する不規則な要求に対応するためにスケールアップまたはスケールダウンを実行
  • 科学的探索のためにリソースを解放

利用されている AWS のサービス

AWS Lambda

AWS Lambda はサーバーレスコンピューティングサービスで、サーバーのプロビジョニングや管理、ワークロード対応のクラスタースケーリングロジックの作成、イベント統合の維持、ランタイムの管理を行わずにコードを実行できます。

詳細 »

AWS Batch

AWS Batch を使用することにより、デベロッパー、科学者、エンジニアは、数十万件のバッチコンピューティングジョブを AWS で簡単かつ効率的に実行できます。

詳細 »

Amazon S3

Amazon Simple Storage Service (Amazon S3) は、業界をリードするスケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。

詳細 »


開始方法

あらゆる業界のさまざまな規模のお客様が、AWS を活用してビジネスを日々変革しています。AWS のエキスパートにお問い合わせのうえ、今すぐ AWS クラウドジャーニーを開始しましょう。