ライフサイエンス

Amazon Web Services にサインアップ

今すぐサインアップ

課題

コストの低下と急速な技術革新の結果、大規模研究機関、個人のラボ、バイオファーマ企業で生成される生物学データのボリュームとスループットが途方もなく増加しています。同時に、ライフサイエンスの研究は、疾病や組織のシステムレベルでの理解を得るために、複数の技術を活用しながら、次第に協働で行われるようになり、複雑化しています。生成されるデータ規模の急激な増加と共同作業の増加が組み合わさった結果、データをどのように格納、分析、共有すべきかを再考する必要が出てきました。

研究者、バイオインフォマティシャン、ソフトウェア開発者、ライフサイエンスの IT 部門は、現在、テラバイト(しばしばペタバイト)のデータを格納、計算、共有できる拡張性ある高可用性の IT インフラストラクチャを作るため、Amazon Web Services(AWS)を活用しています。

AWS パブリックデータセットは、データ共有ができ、AWS クラウドベースのアプリケーションとシームレスに統合可能な集中リポジトリを提供します。人間の遺伝的多様性の最も詳細な地図を構築している国際的な官民コンソーシアム、1000 ゲノムプロジェクトがこの例に含まれます。


利用メリット

弾力性。AWS なら、数分内で容量を縮小・拡張させることが可能です。一から数百、または数千のサーバーインスタンスさえ、同時に作動させることができます。

共有と共同作業。共同作業を行っている人同士が、データ、結果、方法を共有することができる共通のスペースを作成します。

パイプライン分布。他のユーザーにサービスやパイプラインを提供する高い可用性を持つウェブアプリケーションを開発します。実績のあるパイプラインや新技術を代表する Amazon Machine Images(AMI)を配置します。

高い費用対効果。従量課金制で、運用コストと必要性をマッチさせます。研究の合間で働いていない装置への支払いをストップします。

安全。誰がデータにアクセスし、誰がデータを閲覧、編集、追加、削除できるかをコントロールします。通知を介して、すべてのアクセスログを作成・監視します。

サイエンス研究への集中。高規模の分散型インフラストラクチャを構築する心配をせずに、自分のサイエンス研究に集中できます。


ユースケース

製薬会社、バイオテクノロジー企業、研究機関、学術研究所は、AWS を使用することで最も重要な IT 課題のいくつかに対処することができます。

ゲノム配列とデータ配布
低コストで高スループットのゲノム解析機器を利用できることで、大量のゲノム配列のデータを非常に容易に作成できます。加えて、配列実験の並列性のため、コンピューティングリソースへのアクセスにより実験のペースがスロットルされます。

Amazon S3 は、格納・配信するゲノム配列データのために、高い拡張性と可用性、そして堅牢なデータストレージシステムを提供します。Amazon EC2 は、様々なアセンブリ、マッピング、アライメント アプリケーションを実行するための高い拡張性を持ったコンピュートリソースを提供します。Amazon S3 と Amazon EC2 の隣接により、入力データを提供し出力データを永続的に格納できる高帯域幅の接続が得られます。リージョン内での Amazon EC2 と Amazon S3 間のデータ転送には追加の帯域幅コストがかかりません。

AWS は、データの摂取および配信のための様々なオプションを提供しています。小さいデータセットの場合(<~1 TB)、データは通常、当社のウェブ API を介して Amazon S3 に送られます。大規模なゲノムデータセットの場合、データは通常、AWS Import を使用して物理的なメディア上で、または Amazon EC2 のインスタンスで実行されている WAN-optimization ソフトウェアを活用して、AWS に移動されます。データは Amazon S3 から直接配信することも可能ですが、待ち時間の影響が気になるユースケースでは、Amazon CloudFront コンテンツ配信ネットワーク(CDN)から配信されます。非常に大規模なデータセットの場合、データは AWS Import/Export サービスを使用して、物理的なメディア上で AWS 外に移動させることができます。

バイオインフォマティクス
ゲノムとプロテオームデータの分析では、多くの場合、短期間に大量のコンピューティングリソースにアクセスする必要があります。Amazon EC2 の弾性性あるコンピューティング環境により、研究者は様々な生物学的分析の大量データを処理することができます。

分析と処理については、それぞれのユースケースに応じて、データストレージにおける複数のオプションがあります。Amazon S3 は、バッチ処理のために、ワーカーノードにオブジェクトデータをストリーミングするのに理想的です。Amazon EBS は、リレーショナルデータベースなどの高い I/O タスクのためのに、ブロックレベルの直接接続型ストレージを提供しています。Amazon RDS は、簡単に MySQL データベースを管理できるようにするリレーショナルデータベースサービスです。Amazon SimpleDB は、メタデータを格納するためによく使用されるもっとシンプルな非リレーショナルデータベースサービスです。

MapReduce のような新しいパラダイムは、大規模なデータセット処理に最適で、バイオインフォマティクスのアルゴリズムの新品種で活用されています。Amazon EMR は、Hadoop フレームワーク上の AWS に MapReduce アプリケーションを配置するための、簡単に使用できる堅牢なフレームワークを提供します。

パイプラインがクラウド内で作成されると、ソフトウェア開発者や研究者は、簡単に Amazon Machine Images(AMI)を格納・共有することができます。これにより、共同アプリケーションの共有や迅速な分析のリソース展開が可能となります。

創薬
構造ベースの薬物設計、仮想スクリーニング、およびその他の薬物シミュレーションは、医薬品開発の高価な試験段階に入る前に、薬物の有効性に関する予備的な読み取りを提供できるため、大幅な時間とリソースの節約となります。仮想スクリーニングの「驚異的並列」的性質により、研究の速度と質は、多くの場合、コンピュータ能力の拡張性によってのみ制限されます。Amazon EC2 のコンピュートインスタンスを活用することで、十倍、数百倍、さらには数千倍にまでコンピュートインスタンスの回転を上げることができ、迅速に結果を出すことが可能となります。

科学的な協働とデータの一元管理
科学的なデータセットが増加するにつれ、グローバルパートナー間で情報を管理・移動することが非常に困難になってきています。AWS は、拡張性が高く簡単にアクセスできる、実験の計算力に近いデータの集中リポジトリを提供しています。

加えて、クラウドの弾力性と従量課金制により、分散した科学チームは、リソースの用意やデータが格納されるロケーションの決定を心配することなく、より迅速に開始することができます。一旦指定された実験が完了すれば、一部またはすべてのリソースは、継続的な設備コストの負担なしに、縮小することができます。

データは Amazon S3 から直接配信することも可能ですが、待ち時間の影響が気になるユースケースでは、Amazon CloudFront コンテンツ配信ネットワーク(CDN)から配信されます。Amazon Machine Images(AMI)は、実験を容易にするためにクラウドで格納・共有することが可能です。また、EBS のスナップショットを作成すれば、共同作業とデータを容易に共有することができます。


ライフサイエンス リソース





AWS セキュリティセンター
当社の物理的および運用上のセキュリティプロセスの詳細については、最新の AWS セキュリティ白書をダウンロードしてください。

AWS セキュリティセンターに進む



AWS エコノミクスセンター
クラウド コンピューティングの経済的価値を評価できるツールやリソースにアクセスしてください。

AWS エコノミクスセンターに進む



AWS ベストプラクティス白書
この白書は、効率的で拡張性あるクラウドアプリケーションを設計するため、クラウド設計者に規範的なガイダンスを提供しています。

白書をダウンロード

©2011, Amazon Web Services LLC or its affiliates. All rights reserved.