ゲノミクス研究の分野は一世代のうちに極めて急激な変化を遂げようとしています。新しい DNA シーケンシング技術の誕生により、遺伝情報を構成する塩基配列の記録処理にかかる時間とコストが削減されたからです。こうした情報が示す可能性は、シーケンサーが生成するデータの多様性、複雑性、そして膨大な量の影に埋もれている場合もあります。

ゲノミクス研究が複雑さを増す中、それに取り組む作業を支援する新しいツールを模索していた科学者たちは、AWS クラウドが適していることを発見しました。スケーラブルなストレージサービス Amazon S3、伸縮自在なコンピューティングインフラストラクチャ Amazon EC2 に加え、各種の追加データベース、自動化および統合ツールを研究用プラットフォームとして、GenbankEnsemblUniGene、そして1000 Genomes Projectの全データといった有用なデータセットを用い、スケーラブルで再利用がきく解析パイプラインを構築できるのです。

AWS での 1000 Genomes Project の全データについて詳しくは、ビッグデータ製品マネージャーである Matt Wood 氏のブログの投稿を参照してください。


ゲノミクスデータセットの格納と管理は、研究者や研究施設にとって時に大きな足かせとなります。膨大な科学データを読み取り、格納するインフラストラクチャを調達するのは、とかく費用がかさんだり時間がかかったりして、実際の研究にとりかかるまでの大きな障害になるものです。

アマゾンのクラウドストレージサービスなら、データに必要な分だけのストレージを、どのような容量でも、オンデマンドで調達でき、支払いが従量制なので費用も抑えられます。データと同じくクラウドに設置される伸縮自在なコンピューティングサービスを使えば、開発やテストから大規模なハイパフォーマンス製品の実行まで、あらゆる規模に対応する解析ツールを利用することができます。

AWS のストレージおよびコンピューティングサービスは、SNP 検出からハンズオンワークショップ、新薬発見から 30,000 コアを用いた大規模分散コンピューティングに至るまで、あらゆる用途でお客様にご利用いただいております。

現在のゲノミクスでは何テラバイトものデータセットを扱うのが一般的になっただけでも厄介ですが、そのデータに共同で取り組むとなれば一層の困難が予想されます。クラウドならお客様と共同研究者に、一元管理でき、共有可能で、信頼性の高いデータソースを提供できます。共同研究者が廊下の向こうにいようと、別のタイムゾーンにいようと、Amazon のコンピューティングおよびストレージサービスならソースと結果のデータセットを容易に共有できます。また伸縮自在なオンデマンドのコンピューティングインフラストラクチャを解析に利用すれば作業も効率的に進みます。

Amazon S3CloudFrontElastic Block Store などのサービスを使えば、研究データをより自由な形で共有できますし、EC2、Amazon Machine Image、AWS CloudFormation を使えばワークフローや解析ツールを丸ごと共有するのも簡単です。データをどのように、誰と共有するかの管理権限はお客様にあります。デフォルトにより、すべてのデータは非公開で保存され、その保存先は耐障害性を備えた冗長性ストレージアーキテクチャーで、99.999999999% のデータ耐久性を達成しています。そこへのアクセス権限をアカウントやグループ単位で付与したり、IP アドレスで制限したりすることも可能です。データを保管する地理的位置もお客様が管理できます。広範なグローバルインフラストラクチャにより、データの物理的保管場所をリージョン単位で指定できるためです。

データセキュリティの詳細、HIPAA 準拠、FISMA Moderate 認定、またはリスクとコンプライアンスのガイドラインについては、AWS セキュリティセンターをご覧ください。

プログラマブルなインフラストラクチャは高レベルな自動化に適しています。自動化は反復作業でのミス発生を抑えるだけでなく、パイプラインの再利用のしやすさや結果の再現性の向上にもつながります。ソースデータを共同研究者に引き継ぎ、著作物に引用させることはもちろん、お客様のデータや高度にスケーラブルなコンピューティングプラットフォームに加え、お使いのツール、スクリプト、設定およびパイプラインも即座に共有することが可能です。

AWS CloudFormationAmazon Simple WorkflowChefPuppet、それに豊富な AWS SDK といったツールを使えば、環境依存の解決やコンパイラフラグの解読といった苦労に悩まされずに、専門的に設定された、すぐに実行できるパイプラインで研究を始めることができます。これにより、研究者はより迅速でより的確な査読を進められ、発表時の影響力も増すことになるため、きわめて重大な価値が加わります。

アマゾン ウェブ サービスは教育者、学術研究者、学生、教師など AWS クラウドインフラストラクチャの利用を希望する方に対し、サービスクレジットを提供しています。

提供プログラムの詳細、申し込み方法、利用者からの推薦文などについては、AWS in Education のホームページをご覧ください。