Tổng quan

Với AWS HealthOmics, bạn chỉ phải trả tiền cho những gì bạn sử dụng. Bạn bị tính phí dựa trên lượng dữ liệu lưu trữ và phiên bản điện toán mà bạn sử dụng để xử lý quy trình làm việc của mình. Với AWS HealthOmics, bạn có thể lưu trữ các đối tượng dữ liệu trình tự và tham chiếu hoặc dữ liệu biến thể và chú giải. Bạn cũng có thể chạy quy trình làm việc tin sinh học để phân tích và chuyển đổi dữ liệu bộ gen, dữ liệu phiên mã và những dữ liệu omics khác. AWS HealthOmics được tối ưu hóa để lưu trữ và điện toán dữ liệu omics và kết hợp với các dịch vụ khác của AWS như Amazon SageMaker, Dịch vụ lưu trữ đơn giản (S3) của Amazon và Amazon Athena.

Bậc miễn phí

Khi tham gia Bậc miễn phí của AWS, bạn có thể bắt đầu sử dụng AWS HealthOmics miễn phí. Bậc miễn phí của bạn bắt đầu từ tháng đầu tiên khi bạn tạo tài nguyên AWS HealthOmics đầu tiên. Chi tiết về Bậc miễn phí cho AWS HealthOmics có trong bảng bên dưới.

 

Sử dụng Bậc miễn phí mỗi tháng trong 2 tháng đầu tiên

Lưu trữ AWS HealthOmics 1.500 gigabase-tháng trong lớp lưu trữ ở trạng thái hoạt động và 1.500 gigabase-tháng trong lớp lưu trữ ở trạng thái lưu trữ
Quy trình làm việc AWS HealthOmics

275 giờ sử dụng phiên bản omics.m.xlarge hoặc các phiên bản điện toán tương đương và 49.000 GB-giờ đối với kho lưu trữ tác vụ chạy

Phân tích AWS HealthOmics 200 gigabyte-tháng

Định giá lưu trữ AWS HealthOmics

Khi lưu trữ trình tự bộ gen trong kho lưu trữ AWS HealthOmics, bạn sẽ thanh toán cho dung lượng lưu trữ theo số gigabase mỗi tháng. Một gigabase tương đương với một tỷ base từ các tệp trình tự đã nhập của bạn (chẳng hạn như FASTQ, BAM và CRAM). Kho lưu trữ AWS HealthOmics lưu trữ base, điểm chất lượng, bắt cặp trình tự và các siêu dữ liệu khác từ tệp nguồn của bạn. Bạn thanh toán cho mỗi gigabase được lưu trữ, do đó bạn không cần phải bận tâm về định dạng hoặc kỹ thuật nén tệp tối ưu. AWS HealthOmics sẽ thay bạn xử lý toàn bộ những tác vụ đó.

Đối tượng trình tự được gọi là tập phục vụ việc đọc, tương đương với tệp FASTQ, BAM hoặc CRAM về mặt logic. Kho lưu trữ AWS HealthOmics mang đến một lớp lưu trữ ở trạng thái hoạt động và một lớp lưu trữ ở trạng thái lưu trữ cho các tập phục vụ việc đọc của bạn. Chi phí lưu trữ mỗi tháng cho các tập phục vụ việc đọc trong lớp ở trạng thái lưu trữ sẽ thấp hơn so với các tập phục vụ việc đọc trong lớp ở trạng thái hoạt động. Bạn có thể truy cập các tập phục vụ việc đọc trong lớp ở trạng thái hoạt động trong vài mili giây. Tuy nhiên, bạn cần kích hoạt các tập phục vụ việc đọc trong bậc lưu trữ trước thì mới có thể truy cập chúng. Nếu bạn không truy cập các tập phục vụ việc đọc trong 30 ngày, chúng sẽ tự động được chuyển sang lớp lưu trữ ở trạng thái lưu trữ tốn ít chi phí hơn cho đến khi được kích hoạt trở lại.

Chúng tôi không áp dụng phí nhập các tập phục vụ việc đọc. Dữ liệu trong kho lưu trữ AWS HealthOmics bị tính phí thời hạn lưu trữ tối thiểu là 30 ngày, đồng thời dữ liệu bị xóa trước thời hạn 30 ngày sẽ phát sinh phí theo tỷ lệ tương đương với phí lưu trữ cho các ngày còn lại. Kho lưu trữ AWS HealthOmics được thiết kế cho dữ liệu tồn tại lâu dài nhưng không được truy cập thường xuyên và được giữ lại trong nhiều năm.

Bạn thanh toán cho các yêu cầu GET được thực hiện đối với những đối tượng tập phục vụ việc đọc của mình. Tất cả các loại yêu cầu khác đối với tập phục vụ việc đọc đều miễn phí.

Định giá phân tích AWS HealthOmics

Dịch vụ phân tích AWS HealthOmics giúp bạn chuẩn bị dữ liệu biến thể của bộ gen và chú giải bộ gen để sử dụng với bộ dịch vụ máy học và phân tích AWS phong phú, chẳng hạn như Amazon Athena và Amazon SageMaker. Bạn có thể lưu trữ lượng dữ liệu biến thể của bộ gen bất kỳ và chỉ thanh toán cho những gì bạn lưu trữ. Kích thước dữ liệu được định nghĩa là kích thước dữ liệu đã chuyển đổi. Tuy nhiên, khi bạn truy vấn và phân tích dữ liệu trong các dịch vụ khác, bạn sẽ phải thanh toán phí khi sử dụng những dịch vụ đó.

Dữ liệu trong dịch vụ phân tích của AWS HealthOmics bị tính phí thời hạn lưu trữ tối thiểu là 30 ngày. Dữ liệu bị xóa trước thời hạn 30 ngày sẽ phát sinh phí theo tỷ lệ tương đương với phí lưu trữ cho các ngày còn lại.

Định giá quy trình làm việc riêng tư và Ready2Run của AWS HealthOmics

AWS HealthOmics cũng quản lý việc thực hiện các quy trình làm việc tin sinh học với quy trình làm việc riêng tư và Ready2Run.

Quy trình làm việc riêng tư cho phép bạn sử dụng các kịch bản tin sinh học của riêng mình được viết bằng các ngôn ngữ quy trình làm việc được sử dụng phổ biến nhất. Bạn có thể chạy quy trình làm việc riêng tư với một lần thực hiện. Bạn chỉ thanh toán cho những gì mình yêu cầu và bị tính phí riêng cho các loại phiên bản phục vụ ngành khoa học liên quan đến sinh học (omics) và kho lưu trữ tác vụ chạy. Tất cả các tác vụ trong quy trình làm việc của bạn được ánh xạ đến phiên bản phù hợp nhất với những tài nguyên đã xác định thuộc các tác vụ đó. Ví dụ: một tác vụ được xác định sử dụng 8 CPU và 60 GB RAM sẽ ánh xạ đến loại phiên bản omics.r.2xlarge để thực thi.

Quy trình làm việc Ready2Run là quy trình làm việc được tạo sẵn đã được đóng gói bởi các công ty phần mềm bên thứ ba trong ngành công nghiệp cùng các quy trình nguồn mở. Bạn chỉ cần sử dụng quy trình làm việc Ready2Run để xử lý dữ liệu của bạn với các quy trình làm việc được sử dụng phổ biến nhất như Germline và GATK-BP. Quy trình làm việc Ready2Run được tính theo từng lần chạy, nghĩa là bạn phải trả cùng một mức giá cho mỗi quy trình làm việc.

Cả bản ghi của quy trình làm việc riêng tư và quy trình làm việc Ready2Run đều sẽ được lưu trữ trong bản ghi Amazon CloudWatch tại tài khoản của bạn và sẽ bị phí tính trong CloudWatch miễn là bạn chọn giữ lại những bản ghi đó. Bạn có thể cấu hình dịch vụ này để báo cáo việc sử dụng tài nguyên cho mỗi lần chạy nhằm đơn giản hóa hoạt động lập ngân sách, lên kế hoạch và kế toán.

  • Quy trình làm việc riêng tư
  • Quy trình làm việc Ready2Run

Ví dụ định giá

Ví dụ 1

Một sáng kiến giải trình tự quần thể đang bắt tay vào giải trình tự các cá thể từ ngân hàng sinh học đã thu thập được. Sáng kiến này được chọn triển khai tại Khu vực Miền Tây Châu Âu (Ireland). Họ tiến hành giải trình tự 100.000 cá thể, mỗi cá thể có 130 gigabase, sau đó lưu trữ dữ liệu giải trình tự thô trong kho lưu trữ AWS HealthOmics. Trong 5 năm kế tiếp, dữ liệu này vẫn nằm trong lớp lưu trữ ở trạng thái lưu trữ sau 30 ngày kể từ khi nhập và được truy cập trung bình hai lần khi chuyển sang lớp lưu trữ ở trạng thái hoạt động trong 30 ngày. Mỗi bộ gen được tải xuống thành 500 phần, tạo ra 500 lệnh gọi API GET. Tổng chi phí trong 5 năm cho một bộ gen là:
Lớp lưu trữ ở trạng thái hoạt động: 0,005769 USD gigabase/tháng * 130 gigabase * 90 ngày = 2,22 USD
Lớp lưu trữ ở trạng thái lưu trữ: 0,001154 USD gigabase/tháng * 130 gigabase * (1825 – 90) ngày = 8,56 USD.
API GET: 0,005 USD/1.000 lệnh gọi API * (2 * 500 lệnh gọi API) = 0,005 USD
Tổng chi phí trong 5 năm: 2,22 USD + 8,56 USD + 0,005 USD = 10,79 USD (hay 2,16 USD/năm)

Ví dụ 2

Một nhà khoa học tin sinh học muốn chạy một quy trình làm việc Nextflow trong quy trình làm việc của AWS HealthOmics tại Khu vực Miền Đông Hoa Kỳ (Bắc Virginia). Quy trình làm việc của nhà khoa học đó gồm ba tác vụ. Tác vụ đầu tiên đặt trước 16 vCPU và bộ nhớ 30 GB, đồng thời cần 3 giờ để chạy tác vụ. Tác vụ thứ hai đặt trước 32 vCPU và bộ nhớ 160 GB, đồng thời cần 2 giờ để chạy tác vụ. Tác vụ thứ ba đặt trước 4 vCPU và bộ nhớ 10 GB, đồng thời cần 10 phút để chạy tác vụ. Khách hàng này đăng ký quy trình làm việc và thực hiện lệnh gọi API StartRun với hệ thống tệp mặc định có kích thước 1.200 GB. Tổng thể chi phí của nhà khoa học là:
Tác vụ 1 (omics.c.4xlarge): 0,9180 USD/giờ * 3 giờ = 2,754 USD
Tác vụ 2 (omics.r.8xlarge):
2,7216 USD/giờ * 2 giờ = 5,4432 USD
Tác vụ 3 (omics.m.xlarge): 0,2592 USD/giờ * 1/6 giờ = 0,0432 USD
Kho lưu trữ: 0,0001918 USD/GB-giờ * (1.200 GB * (3 giờ + 2 giờ + 1/6 giờ)) = 1,18916 USD
Tổng: 9,42956 USD

Ví dụ 3

Một nhà khoa học dữ liệu có 3.202 tệp định dạng lệnh gọi biến thể (VCF) và muốn phân tích số tệp này trong Amazon Athena tại Khu vực Miền Đông Hoa Kỳ (Bắc Virginia). Nhà khoa học đó tạo một kho lưu trữ biến thể và tải nhập những tệp này bằng cách sử dụng các API của AWS HealthOmics. Dữ liệu đã tải nhập có kích thước 1,5 TB. Trong tháng tiếp theo, nhà khoa học thực thi 1.000 truy vấn trong Athena, tính tần số alen cho các quần thể nhận diện được khác nhau, mỗi quần thể tốn trung bình 50 GB. Tổng thể chi phí hàng tháng của nhà khoa học là:
Kho lưu trữ biến thể: 0,035 USD GB/tháng * (1.024 GB/TB * 1,5 TB) = 53,76 USD
Amazon Athena: 5 USD/TB * 1.000 * 50/1.024 = 244,14 USD

Ví dụ 4

Một nhà khoa học điện toán muốn chạy GATK-BP Germline fq2vcf cho quy trình làm việc 30x gene Ready2Run ở Khu vực Miền Đông Hoa Kỳ (Bắc Virginia) cho 3 mẫu. Khách hàng nhập dữ liệu của mình và thực hiện lệnh gọi API StartRun cho mỗi mẫu. Chi phí cho 3 lần chạy là:
GATK-BP Germline fq2vcf cho quy trình làm việc 30x genome Ready2Run: 10,00 USD/lần chạy * 3 = 30,00 USD
Tổng cộng: 30,00 USD

Tài nguyên định giá khác

Công cụ tính giá AWS

Dễ dàng tính phí hàng tháng của bạn với AWS

Trung tâm tài nguyên kinh tế đám mây

Liên hệ với các chuyên gia AWS để được báo giá riêng