ゲノムデータとは?

ゲノムデータとは、生物のゲノムの構造と機能に関連するデータです。ゲノムは、生物が成長し機能するために必要なすべての細胞データです。ゲノムデータには、生物の遺伝子に含まれる分子の配列などの情報が含まれます。また、各遺伝子の機能、遺伝子発現を制御する調節要素、さまざまな遺伝子とタンパク質間の相互作用も含まれます。生物学者、遺伝学者、データサイエンティストのグローバルネットワークがゲノムデータを収集します。このネットワークにより、今後 10 年間で何エクサバイト (EB) ものゲノムデータが生成されると予想されます。

ゲノムデータサイエンスとは?

ゲノムデータサイエンスは、遺伝学と計算生物学の研究を統計データ分析やコンピュータサイエンスと組み合わせたものです。例えば、ゲノムデータサイエンティストは、DNA 配列のデータを使用して病気を研究し、新しい治療法を発見します。このデータは、疾患に関連する遺伝的変異を特定し、その機能を決定するのに役立ちます。 

ゲノムデータサイエンスには、遺伝子情報の大規模なデータセットを分析するためのさまざまな計算方法とツールが必要です。ゲノムデータサイエンティストは、複数のデータタイプを包括的なモデルに統合する方法を開発する必要があります。これらのモデルでは、個人の遺伝子構成に基づいて一般的な病気のリスクを予測するといったことが可能です。

ゲノムデータ共有とは?

ゲノムデータ共有とは、組織、研究機関、個人などのさまざまなエンティティ間で遺伝子情報を交換することです。これにより、ゲノム研究やデータ分析のためのデータ交換が可能になります。 

科学者は共有されたデータを使用して、遺伝性の病気の治療法の開発、新しい遺伝子マーカーの特定、個別化医療の開発を行っています。

ゲノムデータは通常、国立衛生研究所 (NIH) などの組織が管理する安全なデータベースを通じて共有されます。これらのデータベースにより、研究者はさまざまなソースからの遺伝子情報にアクセスして分析できます。

ゲノムデータにはどのような情報が含まれていますか?

ゲノムデータには通常、以下の情報が含まれます。

RNA

RNA は、細胞内の遺伝子情報を輸送してタンパク質を作る分子です。科学者は、遺伝子発現、RNA 干渉、翻訳などの用途でゲノミクスに RNA を使用しています。

DNA

DNA はすべての生物の遺伝物質です。DNA 配列には、遺伝子の構造と機能に関する情報が含まれています。科学者は DNA データを研究して、病気の原因となる突然変異を特定して特徴づけ、遺伝子がどのように相互作用するかを理解し、新しい遺伝子を発見します。

タンパク質

タンパク質は、多くの細胞プロセスに関与するアミノ酸で構成される分子です。タンパク質は、DNA 配列、遺伝子発現、およびその他の細胞活動において役割を果たします。 

ゲノムデータはなぜ収集されるのですか?

ゲノムデータを収集して、遺伝子情報が生物の発達と機能をどのように支配しているかを理解します。次に、ゲノムデータのいくつかの実用的な応用について説明します。

ライフサイエンス研究

科学者はゲノムデータを収集して、生物の進化の歴史を理解し、調査します。特定の種の進化をたどるために、研究者は遺伝子情報を研究し、種が変化する環境にどのように適応するかを学びます。遺伝子コードを研究することで、科学界は遺伝子が別の遺伝子や環境とどのように相互作用するかについてのインサイトを得ることができます。そして、これらの相互作用が生物の発達と健康にどのように影響するかを学びます。

遺伝性の病気の診断

ゲノムデータは、がん、遺伝子病、遺伝病など、遺伝性の病気の診断とモニタリングに使用されます。特定の遺伝子マーカーを特定し、それをモニタリングすることで、疾患の進行や治療法を決定します。予防医療では、ゲノミクス研究を活用して問題を早期に治療し、治療成績を向上させます。

医薬品開発

科学者はヒトのゲノムデータを使用して、疾患や病状の調査、創薬ターゲットの特定と評価、新しい治療法の開発を行います。ゲノムデータは、効果的な薬や個別化された治療法の開発、および創薬におけるスクリーニングと試験に役立ちます。 

AWS が企業の創薬にどのように役立つかをお読みください »

法医学

法医学者はゲノムデータを研究して刑事事件の容疑者を特定します。DNA データは、容疑者と犯罪現場を結びつけ、無実の人を解放することができます。 

集団遺伝学

ゲノムデータは、集団遺伝学と進化史の研究に使用されます。研究者は、ヒトゲノムデータ分析を通じて、ヒトの移動と人口開発に関するインサイトを得ます。

ゲノムデータ分析にはどのような技術が使われていますか?

ゲノムデータ分析には、さまざまな技術を使用して遺伝子データのパターンと傾向を特定することが含まれます。

バイオインフォマティクスツール

バイオインフォマティクスは、生化学、遺伝学、生理学、分子生物学を含む生物学のすべての分野を、コンピュータサイエンス、応用数学、統計学と組み合わせます。科学者はバイオインフォマティクスを利用して、ゲノム情報を分析および解釈する新しいアルゴリズムとソフトウェアツールを開発しています。バイオインフォマティクスツールを使用すると、研究者はさまざまな種のゲノムデータを比較対照したり、ゲノム配列を特定したり、遺伝子やタンパク質の機能を調べたりすることができます。

機械学習

機械学習は、遺伝的変異、配列モチーフ、制御因子などのゲノムデータのパターンを特定します。アルゴリズムは、ゲノムデータをさまざまなカテゴリに分類したり、遺伝子やタンパク質の機能を予測したり、病気のバイオマーカーを特定したりできます。

AWS での機械学習について読む »

統計ソフトウェア

R や SAS などの統計ソフトウェアは、ゲノムデータを分析して結果を解釈します。遺伝子や形質間の相関関係など、データ内のパターンを特定できます。ソフトウェアは統計的テストを実行し、ゲノムパターンが統計的に有意かどうかを判断します。また、遺伝子病リスクなどの予測モデルも作成します。 

シーケンシング技術

次世代シーケンシング (NGS) やサンガーシーケンシングなどのシーケンシング技術は、バイオインフォマティクスのツールやアルゴリズムで分析するデータを生成します。これらの技術は、DNA および RNA 分子の配列を決定し、データを使用して遺伝的変異の特定、遺伝子発現の分析、突然変異の検出を行います。

可視化ツール

データ視覚化技術はゲノムデータをグラフィカルに表示するため、研究者が理解して解釈しやすくなります。チャート、グラフ、マップなどの視覚要素は、重要なデータポイントを強調し、複雑なゲノムデータセットを簡略化します。科学者は、この視覚的表現を使って、生のゲノムデータから実用的なインサイトを抽出します。

データの可視化について読む »

ビッグデータツール

ビッグデータツールは、ゲノム配列、遺伝子発現、突然変異データなどの大規模なデータセットを分散コンピューティング環境で処理、分析、保存します。その後、このデータを使用してパターン、相関関係、および異常を特定できます。

ビッグデータについて読む »

ゲノムデータ管理の課題とは?

ボリュームとプライバシーはどちらも、ゲノムデータ管理における最も重要な課題です。

ボリューム

ゲノムデータセットは膨大であるため、それらを管理および保存することは大きな課題です。これらを従来のデータベースに保存するのが難しい理由はいくつかあります。

  • ゲノムデータは非常に複雑で、複数の相互リンクによりデータの重複が生じる
  • データは常に増加し変化するため、頻繁に更新する必要がある
  • 高度なアルゴリズムでは、データ分析のためにデータを複雑な方法で事前にフォーマットする必要がある

組織は、ゲノムデータを分析するために大量の計算能力とストレージリソースを必要とします。

プライバシー

ゲノムデータには、個人の健康状態や病歴に関する情報が含まれています。情報は機密性が高く、悪用される可能性があるため、プライバシーは重大な課題です。

例えば、ゲノムデータにより、特定の疾患や状態のリスクが高い個人を特定できます。そのため、データが悪用されて遺伝子情報に基づく差別が行われる可能性があります。悪用を防ぐために、企業はゲノムデータ管理におけるアクセス制御と高レベルのセキュリティを確保する必要があります。

AWS はゲノムデータの要件をどのようにサポートできますか?

Amazon Web Services (AWS) では、お客様のゲノムデータ要件をサポートするために Amazon Omics を提供しています。Omics により、ヘルスケア/ライフサイエンス組織は、ゲノムデータを迅速かつ効率的に保存、クエリ、分析できます。

時間のかかる作業を合理化することで、ゲノミクス研究をより早く進めることができます。健康状態の改善と科学の進歩の推進に集中できます。

研究に Omics を活用するメリットは次のとおりです。

  • バイオインフォマティクスのファイル形式に対応した、無制限の専用ストレージ
  • スケーラブルなバイオインフォマティクスワークフローとデータ分析
  • ゲノムデータ共有のためのデータコラボレーションとガバナンス

今すぐ無料の AWS アカウントを作成して、AWS 上でゲノミクスデータの使用を開始しましょう。

AWS での次のステップ

追加の製品関連リソースを確認する
アナリティクスサービスを確認 
無料のアカウントにサインアップする

AWS 無料利用枠にすぐにアクセスできます。

サインアップ 
コンソールで構築を開始する

AWS マネジメントコンソールで構築を始めましょう。

サインイン