Amazon Omics は、ゲノム、トランスクリプトーム、およびその他のオミクスデータにおける保存、クエリ、分析を簡略化し、そのデータを利用してインサイトをもたらします。また、研究および臨床アプリケーションで用いるマルチオミクス情報の保存および解析プロセスの簡略化、高速化を実現します。これにより、データからさらに深いインサイトを引き出すことに集中できます。

Amazon Omics ストレージを使用すると、ペタバイト規模のオミクスデータを効率的かつ効果的に保存できるため、集団規模の科学的発見を可能にします。Amazon Omics ワークフローは、コンピューティングインフラストラクチャのプロビジョニングおよびスケーリングを自動化するため、バイオインフォマティクスに関する分析パイプラインを本番環境のスケールで実行できるようになります。インフラストラクチャの管理に費やす時間が削減されるため、研究に充てる時間を増やすことが可能です。Amazon Omics 分析は、マルチモーダル分析で使用するオミクスデータの準備を簡略化します。マルチオミクスデータと健康記録データを組み合わせて、さらにターゲットを絞り込んでパーソナライズされた治療を実現します。これらの機能は、HIPAA にも対応しています。

全般

専用ストレージ

Amazon Omics ストレージは、FASTQ、BAM、CRAM といったバイオインフォマティクスのファイル形式に対応しています。そのため、これらのデータを効率的かつ低コストで保存、発見、共有できます。これらのファイル形式は、シーケンスストア内のリードセットオブジェクトとして保存されます。また、リファレンスゲノムを FASTA 形式で保存することも可能です。データは、一意の識別子を持つイミュータブルなオブジェクトとしてインポートされ、厳密なデータの出所を必要とするワークロードに対応します。AWS Identity and Access Management (IAM) のタグおよび属性ベースのアクセス制御を使用することで、リファレンスやリードセットオブジェクトを含む個々のデータオブジェクトへのアクセスを制御できます。また、長期保管コストを削減するため、30 日以内にアクセスされなかったデータオブジェクトは、自動的にアーカイブストレージクラスに移動されます。アーカイブされたオブジェクトは、API コールでいつでも最有効化できます。

バイオインフォマティクスワークフロー

Amazon Omics は、大規模なバイオインフォマティクスワークフローを実行するのに役立ちます。ワークフロー定義、使用ツール、分析データを指定すると、Amazon Omics は基盤となるインフラストラクチャをプロビジョニングして、ワークフローを実装します。また、WDL 1.1 および Nextflow 22.04.0 DSL2 仕様に準拠したワークフロー定義がサポートされています。ワークフローでは、OCI に準拠するコンテナ化されたツールを使用します。これは、Amazon Elastic Container Registry (ECR) のプライベートレジストリに保存されています。S3 バケットまたは Amazon Omics シーケンスストアからのデータが分析可能です。特定のワークフローにアクセスできるユーザーや、使用されるリソース総量を制御できます。また、ワークフローの実行グループを使用して実装の優先順位を管理できます。

大規模な分析

Amazon Omics を使用すると、(g)VCF、GFF3、TSV/CSV などのゲノミクスデータ形式を迅速に取り込み、Apache Parquet に変換できます。Amazon Athena などの分析サービスを介して、ゲノミクスデータをアクセス可能にすることができます。バリアントデータ (個々のサンプルからのデータ) とアノテーションデータ (ゲノム内の位置に関する既知の情報) は、どちらも変換できます。AWS Lake Formation を使用すると、分析ストアへのアクセスを制御できます。これにより、きめ細かいアクセス制御を実装するとともに、さまざまなデータソースにわたってクエリを実行しやすくなります。例えば、個人のゲノムデータと、Amazon HealthLake に保存された病歴 (過去の治療、投薬、検査報告などを含めることが可能) を安全に組み合わせることで、精密医療を容易にします。

データのコラボレーションおよび出所

Amazon Omics では、共同研究者へのタグ付け、権限の設定、および安全なデータ共有を簡単に行えます。また、オミクスデータの検索可能、アクセス可能、相互運用可能、再利用可能 (FAIR) を実現する方法を簡略化します。ドメイン固有のメタデータを使用すると、Amazon Omics データストアを他のオミクスデータやヘルスケアデータにリンクできます。そのため、マルチオミクスおよびマルチモーダル分析が容易になります。

セキュリティ、プライバシー、コンプライアンス

HIPAA 対応

Amazon Omics は HIPAA に対応しています。属性ベースの制御を適用して、きめ細かいデータアクセスおよびガバナンスを定義できます。包括的なログ記録と出所の取得機能が組み込まれているため、どのデータに、誰が、いつアクセスしたかを把握できます。