23andMe のロゴ

23andMe が AWS で HPC を利用して創薬と治療薬の発見を革新

2022 年

ゲノミクスおよびバイオテクノロジー企業である 23andMe は、お客様に遺伝子検査を直接提供することで、お客様が遺伝子に関する貴重なインサイトを入手できるようにしています。23andMe は、数ペタバイトのデータを効率的に管理するために、ハイパフォーマンスコンピューティング (HPC) におけるより高いスケーラビリティと柔軟性を必要としていました。同社はオンプレミスソリューションを利用していましたが、2016 年に Amazon Web Services (AWS) を利用して重要なデータを保存し始めました。2021 年、同社はクラウドに完全に移行しました。このプロセスに要した時間はわずか 4 か月間でした。事実上あらゆるワークロード用に安全でサイズ変更可能なコンピューティングキャパシティを提供する Amazon Elastic Compute Cloud (Amazon EC2) や、デベロッパー、科学者、エンジニアが AWS で何十万ものバッチコンピューティングジョブを簡単かつ効率的に実行できるようにする AWS Batch などの AWS の HPC サービスを採用して以来、23andMe は、スケーラビリティと柔軟性を高め、コスト最適化を推し進めることができました。

case-study-600x300
kr_quotemark

スケーラビリティに関する 1 つの実例としては、当社のピーク時のコンピューティングジョブでは、80,000 を超える仮想 CPU が同時に稼働していました。Amazon EC2 を利用することで、23andMe の研究者のリソース競合が解消されました"

Arnold de Leon 氏
23andMe、シニアプログラムマネージャー

 

安全なデータストレージのためのクラウドの活用

カリフォルニア州に本社を置く 23andMe は、家庭用の DNA 採取キットを提供する企業として広く知られています。また、同社では遺伝子情報のデータベースを利用して、生物学や治療法の理解を深め、新薬や新たな治療法を開発しています。2006 年に設立された 23andMe は、研究と治療法の開発のために膨大な量のデータを収集し、数百万行のコードを生成してきました。同社はこのデータを回帰分析、ゲノムワイド関連研究、およびデータセット全体の一般的な相関研究に利用しています。遺伝子検査市場は、過去 16 年間にわたる遺伝病の有病率の増加、早期発見のメリットに関する公衆の意識の高まり、遺伝子配列決定のコスト低下により、その勢いを増しています。
 
23andMe は当初、オンプレミスの施設を利用していましたが、データストレージとコンピューティングのニーズが高まるにつれ、スケーラビリティと柔軟性を高めるためにクラウドに目を向け始めました。さらに、同社はクラウドに移行することで、施設のメンテナンスにかかる人件費を削減し、新しいハードウェアやテクノロジーを採用する能力を高めることを目指していました。2016 年、同社は、スケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスである Amazon Simple Storage Service (Amazon S3) の使用を開始しました。「気になるデータがあれば Amazon S3 に保存しています」と 23andMe のクラウド支出担当プログラムマネージャーである Arnold de Leon 氏は述べています。「Amazon S3 は、データの耐久性の観点からデータを保護する優れた方法と言えます」。 23andMe は Amazon S3 インテリジェント階層化ストレージクラスを利用して、アクセスパターンが変化したときに、最も費用対効果の高いアクセス階層に自動的にデータを移行します。
 
23andMe は、クラウドサービスの利用を開始するにあたり、データセンターと AWS で同時にワークロードを実行するハイブリッドソリューションを試しました。このソリューションはある程度のスケーラビリティを提供しましたが、オンプレミスのデータセンターとクラウドの間でデータを移行するにはそれなりのコストが伴いました。23andMe は、柔軟性とスケーラビリティをより高めながらコストをより最適化するために、2021 年に完全に AWS に移行することを決定しました。

AWS で HPC を実行することの価値の最適化

23andMe は、AWS が何千もの企業のお客様をクラウドに移行した経験に基づく、包括的で実績のあるクラウド移行プログラムである AWS Migration Acceleration Program (AWS MAP) を利用しました。AWS MAP を利用することで、23andMe はわずか 4 か月でスムーズな移行を実現できました。「AWS MAP により、当社は迅速で大規模なシフトを実行できました」と de Leon 氏は述べています。「通常、これを実行するには非常に費用がかかりますが、AWS MAP はその問題を解決してくれました」。 23andMe は、すべてをデータセンターから AWS のクラウドに移行しました。AWS への移行から 1 年後、23andMe の AWS MAP プログラムが終了し、チームが AWS のサービスの採用を積極的に推進したおかげで、現在では同等以上の料金パフォーマンスを達成しています。

科学者のファイルベースのホームディレクトリの管理では、別の課題が生じていました。この問題を解決するために、23andMe は AWS パートナーである Weka に依頼することにしました。WekaIO パラレルファイルシステムは機能的で費用対効果が高く、Amazon S3 と互換性があります。これにより、23andMe の社内チームは、カスタマーエクスペリエンスに悪影響を及ぼすことなく、変更を実装することができました。移行が完了すると、23andMe は Amazon EC2 C5 インスタンスなどの HPC 向けの AWS のサービスを利用し始めました。これらのサービスは、コンピューティングを多用する高度なワークロードを実行する際に、コンピューティングあたりの料金を低く抑えながら、費用対効果の高いハイパフォーマンスを実現します。同社がこのタイプの Amazon EC2 インスタンスを選んだのは、以前のコンピューティングリソースに最も近いものだったからです。

23andMe は、さまざまな Amazon EC2 インスタンスタイプを利用できることのメリットにすぐに気付きました。「当社は Amazon EC2 サービスをすべて利用できるのです。そして効率を上げる方法の 1 つは、リソースの利用に最適なサービスを見つけることです」と 23andMe のインフラストラクチャエンジニアリンググループのマネージャーである Justin Graham 氏は述べています。2022 年現在、同社は Amazon EC2 X2i インスタンスなど、多くのインスタンスタイプを柔軟に利用しています。Amazon EC2 X2i インスタンスは、次世代のメモリ最適化インスタンスであり、メモリを大量に消費するワークロードのパフォーマンス、料金、コストを改善します。23andMe では、AWS Batch を利用してサイズを適正化し、リソースをマッチングさせて利用するインスタンスタイプを決定することもできます。これはコストパフォーマンスの最適化に役立ちます。

23andMe は、実際のワークロード用のコンピューティングキャパシティに合わせてオンデマンドでスケールした後、スケールダウンして元に戻すことができます。「スケーラビリティに関する 1 つの実例としては、当社のピーク時のコンピューティングジョブでは、80,000 を超える仮想 CPU が同時に稼働していました」と de Leon 氏は述べています。さらに、Amazon EC2 インスタンスを利用することで、23andMe の研究者のリソース競合が解消されました」。「最近、3 週間かかる予定だった本番ワークロードが、予定よりも 33% 早く完了しました。AWS に移行してから、当社が研究者にコンピューティングリソースを提供する能力は、他に類を見ないほど向上しました」と Graham 氏は述べています。

23andMe は、AWS 上で HPC サービスを利用することでこのような恩恵を享受する一方で、当初の支出目標について妥協する必要はありませんでした。「当社の目標は、以前と変わらないコストで、柔軟性、能力、価値を高めることにありました。コスト削減は収益よりも、支出から何を得られるかということに関連しています」と de Leon 氏は述べています。23andMe は、クラウドでデータベースを簡単に設定、運用、スケールできるようにするマネージドサービスの集まりである Amazon Relational Database Service (Amazon RDS) や Amazon EC2 など、さまざまな AWS のサービスを利用することで、コストの最適化を実現してきました。23andMe は AWS を全面的に利用しており、今後もワークロードのコストパフォーマンスの最適化を追求していくことを目指しています。

AWS の柔軟性を活用した将来の可能性の探求

23andMe は既存の環境をほとんど変更することなく移行でき、時間が経過するにつれて、より多くの AWS のサービスをソリューションに組み込むようになりました。同社は AWS を利用してコストを最適化するさらなる方法を模索しています。その一環として、Amazon EC2 で実行されるクラウドワークロード向けに優れたコストパフォーマンスを提供する AWS Graviton プロセッサなどのサービスを検討しています。同社は、オンデマンドコンピューティングに必要なリソースを維持しながら、コストを最適化する機会を探しています。「移行してから 10 か月が経過しようとしています。最終的な目標は、アイデアから検証までのプロセスを迅速化することです。当社の研究者はより迅速かつ効率的になっています。研究が飛躍的に進歩することを期待しています」と de Leon 氏は述べています。 


23andMe について

カリフォルニア州に拠点を置くゲノミクスおよびバイオテクノロジー企業である 23andMe は、遺伝情報を顧客に提供しているほか、研究のために何十億ものデータポイントをクラウドソーシングしてきました。それは科学的な発見につながっています。

AWS の利点

  • 4 か月以内でクラウドにスムーズに移行
  • 研究者間のコンピューティングリソースの競合を解消
  • スケーラビリティが向上し、80,000 を超える仮想 CPU で実行されるコンピューティングジョブをサポート
  • 効率が向上し、3 週間かかる予定だった本番ワークロードを予定よりも 33% 早く完了
  • 最適化されたコスト

利用されている AWS のサービス

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) は、極めて幅広く、詳細な機能を提供するコンピューティングプラットフォームを提供します。また、ワークロードのニーズに最適に対応できるように、500 を超えるインスタンスを提供するほか、最新のプロセッサ、ストレージ、ネットワーク、オペレーティングシステム、購入モデルを選択できます。

詳細はこちら »

Amazon S3

Amazon Simple Storage Service (Amazon S3) は、業界随一のスケーラビリティ、データ可用性、セキュリティ、パフォーマンスを提供するオブジェクトストレージサービスです。

詳細はこちら »

Amazon MAP

AWS Migration Acceleration Program (MAP) は、実績のある包括的クラウド移行プログラムであり、何千もの企業のお客様をクラウドに移行してきた AWS の経験に基づいています。

詳細はこちら »

AWS Batch

AWS Batch を使用することにより、デベロッパー、科学者、エンジニアは、数十万件のバッチコンピューティングジョブを AWS で簡単かつ効率的に実行できます。

詳細はこちら »


開始方法

あらゆる業界のさまざまな規模の組織が AWS を活用して日々変革し、ミッションを遂行しています。
私たちのエキスパートにお問い合わせのうえ、今すぐAWSクラウドジャーニーを始めてください。