Tổng quan
Với Amazon Redshift, bạn có thể bắt đầu với mức chi phí thấp 0,25 USD mỗi giờ và mở rộng quy mô lên đến hàng petabyte dữ liệu cũng như hàng nghìn người dùng đồng thời. Hãy chọn những gì phù hợp với nhu cầu kinh doanh của mình, cùng với khả năng tăng dung lượng lưu trữ mà không cần cung cấp điện toán hoặc lưu trữ vượt mức. Với Amazon Redshift được cung cấp, bạn có thể chọn Phiên bản theo nhu cầu và thanh toán chi phí cơ sở dữ liệu theo giờ mà không cần cam kết dài hạn hay trả trước hoặc chọn Phiên bản đặt trước để tiết kiệm hơn nữa. Ngoài ra còn có Amazon Redshift Serverless, cho phép bạn trả phí sử dụng dựa trên việc tự động khởi động, tắt và tăng/giảm dung lượng theo nhu cầu của ứng dụng, nên bạn chỉ phải trả chi phí dung lượng tiêu thụ trong khi xử lý khối lượng công việc.
Những điều cần lưu ý về Amazon Redshift được cung cấp:
Trước tiên, hãy tìm hiểu thêm về các loại nút để bạn có thể chọn cấu hình cụm tốt nhất cho nhu cầu của mình. Bạn có thể nhanh chóng thay đổi quy mô cụm của mình, tạm dừng và tiếp tục cụm cũng như chuyển đổi giữa các loại nút bằng một lệnh gọi API duy nhất hoặc chỉ bằng vài cú nhấp chuột trong bảng điều khiển Redshift. Bạn sẽ thấy giá theo nhu cầu trước khi lựa chọn và sau đó có thể chọn mua các nút dành riêng để được giảm giá đáng kể.
Sau khi lựa chọn, bạn có thể sử dụng công cụ Thay đổi kích thước linh hoạt để dễ dàng điều chỉnh năng lực điện toán được cung cấp chỉ trong vài phút, hỗ trợ xử lý ở trạng thái ổn định. Với Trình lập lịch thay đổi kích thước, bạn có thể thêm và xóa nút mạng hàng ngày hoặc hàng tuần để tối ưu hóa chi phí và đạt được hiệu năng tốt nhất. Đối với khối lượng công việc hay thay đổi, bạn có thể sử dụng tính năng Thay đổi quy mô đồng thời để tự động tăng năng lực điện toán và chỉ thanh toán theo mức sử dụng tính trên mỗi giây sau khi dùng hết các khoản tín dụng miễn phí (xem Tính giá Thay đổi quy mô đồng thời).
Công cụ tính giá AWS
Tính toán chi phí của kiến trúc và Amazon Redshift chỉ với một ước tính duy nhất.
Các loại nút Amazon Redshift
Các nút RA3 với dung lượng lưu trữ được quản lý cho phép bạn tối ưu hóa kho dữ liệu của mình bằng cách thay đổi quy mô và thanh toán riêng chi phí điện toán và dung lượng lưu trữ được quản lý. Với RA3, bạn chọn số lượng nút dựa trên yêu cầu hiệu năng của mình và chỉ thanh toán chi phí dung lượng lưu trữ được quản lý mà bạn sử dụng. Bạn nên định cỡ cho cụm RA3 của mình dựa trên lượng dữ liệu xử lý hàng ngày.
Bộ lưu trữ được Redshift quản lý (RMS) sử dụng các ổ cứng thể rắn (SSD) lớn, hiệu năng cao trong mỗi nút RA3 để lưu trữ cục bộ nhanh chóng, đồng thời sử dụng Amazon Simple Storage Service (Amazon S3) để lưu trữ lâu bền và dài hạn hơn. Nếu dữ liệu trong một nút chiếm dung lượng lớn hơn kích thước của các SSD lớn cục bộ, RMS sẽ tự động giảm tải dữ liệu sang Amazon S3. Bạn thanh toán một mức phí thấp cố định cho RMS, bất kể dữ liệu nằm ở các SSD hiệu năng cao hay ở Amazon S3. Đối với khối lượng công việc yêu cầu dung lượng lưu trữ ngày càng tăng, dung lượng lưu trữ được quản lý cho phép bạn tự động thay đổi quy mô dung lượng lưu trữ của kho dữ liệu mà không cần thêm nút và thanh toán chi phí sử dụng các nút đó.
Các nút DC2 cho phép bạn tạo kho dữ liệu có cường độ điện toán lớn với lưu trữ SSD cục bộ đi kèm. Chọn số lượng nút bạn cần dựa trên kích cỡ dữ liệu và yêu cầu hiệu năng. Các nút DC2 lưu trữ dữ liệu cục bộ để có hiệu năng cao và khi kích thước dữ liệu tăng lên, bạn có thể thêm nhiều nút điện toán để tăng dung lượng lưu trữ của cụm. Đối với bộ dữ liệu dưới 1 TB không nén, chúng tôi khuyên dùng các loại nút DC2 để đạt hiệu năng tốt nhất với mức giá thấp nhất. Nếu bạn dự kiến dữ liệu tăng lên, chúng tôi khuyên bạn nên sử dụng các nút RA3 để có thể định cỡ riêng điện toán và dung lượng lưu trữ, qua đó có được mức giá và đạt hiệu năng tốt nhất.
Các khả năng của Redshift tính giá theo mức sử dụng
- Các loại nút Amazon Redshift: Bạn có thể chọn cấu hình cụm và loại nút tốt nhất cho nhu cầu của mình, đồng thời có thể thanh toán dựa trên công suất theo giờ nhờ áp dụng phương thức tính giá Amazon Redshift theo nhu cầu. Khi bạn chọn tính giá theo nhu cầu, bạn có thể sử dụng tính năngtạm dừng và tiếp tục để tạm dừng thanh toán theo nhu cầu khi không sử dụng một cụm nào đó. Nếu xử lý khối lượng công việc ở trạng thái ổn định, bạn cũng có thể chọn Phiên bản đặt trước thay cho phiên bản theo nhu cầu để được chiết khấu đáng kể.
- Tính giá Amazon Redshift Spectrum: Chạy truy vấn SQL trực tiếp với dữ liệu trong hồ dữ liệu Amazon S3, tính đến mức exabyte – bạn chỉ phải thanh toán theo số lượng byte được quét.
- Tính giá Điều chỉnh quy mô đồng thời: Mỗi cụm được nhận tối đa một giờ tín dụng Điều chỉnh quy mô đồng thời miễn phí mỗi ngày, đủ cho 97% khách hàng. Điều này cho phép bạn đảm bảo hiệu năng nhanh nhất quán, ngay cả khi có hàng nghìn người dùng và truy vấn đồng thời. Bạn chỉ phải thanh toán mức phí sử dụng theo nhu cầu tính theo giây nếu sử dụng vượt quá các khoản tín dụng miễn phí.
- Tính giá RMS: Chỉ phải thanh toán cho dữ liệu bạn lưu trữ trong các cụm RA3, không phụ thuộc vào số lượng nút điện toán được cung cấp. Bạn chỉ cần trả tiền theo giờ cho tổng lượng dữ liệu trong dung lượng lưu trữ được quản lý. RMS cũng được sử dụng với Amazon Redshift Serverless.
- Redshift ML: Sử dụng SQL để tạo, đào tạo và triển khai các mô hình máy học (ML). Sau khi bạn sử dụng hết bậc miễn phí cho Amazon SageMaker, bạn sẽ phải chịu chi phí cho việc tạo mô hình và dung lượng lưu trữ của mình. Redshift ML cũng có thể sử dụng với Amazon Redshift phi máy chủ.
Bản dùng thử Amazon Redshift miễn phí
Nếu chưa từng sử dụng Amazon Redshift phi máy chủ thì bạn sẽ đủ điều kiện nhận khoản tín dụng 300 USD có hạn trong 90 ngày cho việc sử dụng điện toán và dung lượng lưu trữ. Tốc độ tiêu thụ tín dụng này phụ thuộc vào mức sử dụng thực tế và năng lực điện toán của điểm cuối phi máy chủ của bạn.
Ở những khu vực chưa hỗ trợ Amazon Redshift phi máy chủ, khách hàng có thể bắt đầu dùng thử miễn phí các cụm được cung cấp. Bạn đủ điều kiện dùng thử miễn phí nút DC2 lớn của chúng tôi trong hai tháng. Tổ chức của bạn sẽ nhận được 750 giờ miễn phí mỗi tháng, đủ để chạy liên tục một nút DC2 lớn với 160 GB dung lượng lưu trữ SSD nén. Sau khi hết hai tháng dùng thử miễn phí hoặc mức sử dụng của bạn vượt quá 750 giờ mỗi tháng, bạn có thể tắt cụm để tránh phát sinh bất kỳ khoản phí nào hoặc tiếp tục chạy cụm với mức Phí theo nhu cầu tiêu chuẩn của chúng tôi. Vui lòng truy cập trang bản dùng thử Amazon Redshift miễn phí để tìm hiểu thêm.
Định giá theo nhu cầu
Phương thức tính giá theo nhu cầu của Amazon Redshift cho phép bạn thanh toán dựa trên dung lượng được cung cấp theo giờ mà không có cam kết và không phải trả trước cho loại nút cụ thể mà bạn chọn để chạy kho dữ liệu của mình. Bạn chỉ cần thanh toán mức phí theo giờ dựa trên loại và số lượng nút đã chọn trong cụm của bạn, cụm còn chạy thì bạn còn mất phí. Nếu thời gian sử dụng dưới một giờ, phí được tính theo gia số một giây sau khi thực hiện những thay đổi trạng thái có tính phí như tạo, xóa, tạm dừng hoặc tiếp tục cụm. Tính năng tạm dừng và tiếp tục cho phép bạn tạm dừng tính phí theo nhu cầu trong suốt khoảng thời gian cụm bị tạm dừng. Tạm dừng và tiếp tục là thao tác thủ công hoặc được lên lịch trên các loại nút Redshift. Trong suốt khoảng thời gian cụm bị tạm dừng, bạn chỉ cần thanh toán phí lưu trữ bản sao lưu. Cách tính này sẽ giúp bạn không cần lên kế hoạch và mua dung lượng kho dữ liệu trước khi phát sinh nhu cầu sử dụng, đồng thời cho phép bạn đảm bảo hiệu quả chi phí trong việc quản lý các môi trường phát triển hoặc chạy thử. Đối với triển khai nhiều vùng sẵn sàng, bạn sẽ trả cùng mức phí thanh toán nhưng gấp đôi chi phí điện toán so với mức phải trả khi triển khai một vùng sẵn sàng.
Thế hệ hiện tại
*Tổng dung lượng lưu trữ có địa chỉ dễ xác định trong bộ lưu trữ được quản lý với mỗi nút RA3.
Thế hệ trước
Tính toán mức giá theo nhu cầu thực tế trên mỗi TB/năm
Đối với cách tính giá theo nhu cầu, mức giá thực tế mỗi TB mỗi năm là mức giá hàng giờ cho phiên bản nhân với số giờ trong một năm rồi chia cho số TB mỗi phiên bản. Đối với RA3, dữ liệu lưu trữ trong bộ lưu trữ được quản lý sẽ được tính phí riêng dựa trên dữ liệu thực tế lưu trong các loại nút RA3; giá thực tế trên mỗi TB hàng năm chỉ được tính để xác định chi phí nút điện toán.
Amazon Redshift phi máy chủ
Bạn có thể bắt đầu sử dụng Amazon Redshift phi máy chủ với giá thấp nhất là 3 USD mỗi giờ và bạn chỉ phải trả chi phí năng lực điện toán mà kho dữ liệu của bạn sử dụng khi hoạt động. Dung lượng kho dữ liệu của bạn sẽ tự động tăng hoặc giảm quy mô theo tài nguyên để đáp ứng nhu cầu về khối lượng công việc phân tích và tắt đi khi không có hoạt động, giúp bạn tiết kiệm chi phí và thời gian quản trị. Amazon Redshift đo dung lượng kho dữ liệu bằng Đơn vị xử lý Redshift (RPU). Bạn thanh toán dựa trên khối lượng công việc bạn chạy tính bằng RPU giờ theo từng giây (tính phí tối thiểu 60 giây), bao gồm cả các truy vấn truy cập vào dữ liệu ở định dạng tệp mở trong Amazon S3. Bạn không phải trả phí thời gian khởi động kho dữ liệu. Amazon Redshift có khả năng tự động thay đổi quy mô và bảo mật toàn diện. Bạn không cần phải thanh toán riêng chi phí điều chỉnh quy mô đồng thời và Redshift Spectrum vì cả hai đều có trong Amazon Redshift phi máy chủ.
Bạn có thể tùy chọn sử dụng cài đặt Cơ bản, RPU-giờ tối đa và RPU tối đa (dung lượng tối đa) để kiểm soát hiệu năng và chi phí kho dữ liệu.
- Cơ bản – Chế độ cài đặt này cho phép bạn chỉ định dung lượng kho dữ liệu cơ sở mà Amazon Redshift sử dụng để phục vụ các truy vấn. Công suất cơ bản được tính theo RPU. Việc đặt năng lực điện toán cơ bản cao hơn có thể cải thiện hiệu năng truy vấn, đặc biệt là đối với các tác vụ xử lý dữ liệu và ETL (trích xuất, chuyển đổi, tải) xử lý lượng lớn dữ liệu cũng như chuyển đổi và bổ sung. Bạn có thể điều chỉnh chế độ cài đặt Cơ bản từ 8 RPU đến 512 RPU vơi mức tăng 8 đơn vị mỗi lần (8, 16, 24, 32, 40, 48, v.v., tối đa tới 512) từ bảng điều khiển quản lý Amazon Redshift hoặc bằng cách khởi chạy API Amazon Redshift.
- Tối đa – Chế độ cài đặt này cho phép bạn chỉ định giới hạn sử dụng và xác định các hành động mà Amazon Redshift tự động thực hiện nếu đạt đến các giới hạn đó để duy trì ngân sách trong khả năng dự đoán. Chế độ cài đặt Tối đa được tính bằng RPU giờ, gắn với thời lượng hàng ngày, hàng tuần hoặc hàng tháng. Việc đặt năng lực điện toán tối đa cao hơn có thể cải thiện thông lượng tổng thể của hệ thống, điều này đặc biệt có lợi cho khối lượng công việc cần xử lý đồng thời cao trong khi duy trì hiệu năng cao ổn định. Bạn có thể điều chỉnh chế độ cài đặt Tối đa từ bảng điều khiển quản lý Amazon Redshift hoặc bằng cách gọi API Amazon Redshift.
- RPU tối đa (Dung lượng tối đa) – Cài đặt này thiết lập số lượng RPU cao nhất mà Amazon Redshift phi máy chủ có thể đáp ứng cho mục đích điều chỉnh quy mô. Khi cần điều chỉnh quy mô điện toán tự động, RPU tối đa có giá trị cao hơn có thể giúp tăng cường thông lượng truy vấn. Khi đạt đến giới hạn RPU tối đa, dịch vụ điện toán dành cho nhóm làm việc sẽ không tăng quy mô tài nguyên thêm nữa.
Dung lượng lưu trữ chính được tính phí theo Bộ lưu trữ được Redshift quản lý (RMS) và dung lượng lưu trữ dùng cho ảnh chụp nhanh của người dùng được tính phí theo mức phí sao lưu tiêu chuẩn được nêu trên trang này. Bộ lưu trữ được tính cùng mức phí như các cụm do Amazon Redshift cung cấp. Với Amazon Redshift phi máy chủ, bạn được miễn phí khôi phục kho dữ liệu về các điểm cụ thể trong 24 giờ trước với độ chi tiết đến 30 phút. Chi phí truyền dữ liệu và chi phí ML được áp dụng riêng, giống như các cụm được cung cấp. Việc sao chép bản kết xuất nhanh và chia sẻ dữ liệu trên các Khu vực AWS được tính theo mức phí truyền dữ liệu được nêu trên trang này.
Tính giá bộ lưu trữ được Amazon Redshift quản lý
Bạn trả tiền cho dữ liệu được lưu trữ trong bộ lưu trữ được quản lý theo mức giá GB-tháng cố định cho khu vực của bạn. Lưu trữ được quản lý chỉ dành riêng cho các loại nút RA3, đồng thời bạn sẽ trả mức giá thấp tương tự cho dung lượng lưu trữ được Redshift quản lý, bất kể kích thước dữ liệu là bao nhiêu. Việc sử dụng dung lượng lưu trữ được quản lý được tính toán theo giờ dựa trên tổng dữ liệu hiện có trong dung lượng lưu trữ được quản lý (xem ví dụ bên dưới về việc chuyển đổi mức sử dụng theo GB-giờ sang tính phí theo GB-tháng). Bạn có thể theo dõi lượng dữ liệu trong cụm RA3 của mình thông qua Amazon CloudWatch hoặc Bảng điều khiển quản lý AWS. Bạn không thanh toán cho bất kỳ khoản phí chuyển dữ liệu nào giữa các nút RA3 và dung lượng lưu trữ được quản lý. Phí cho dung lượng lưu trữ được quản lý không bao gồm phí lưu trữ sao lưu từ các bản kết xuất nhanh tự động và thủ công (xem Lưu trữ sao lưu). Khi cụm kết thúc, bạn tiếp tục bị tính phí cho việc giữ lại các bản sao lưu thủ công của mình.
Ví dụ về giá của bộ lưu trữ được quản lý
Hãy chuyển đổi tổng mức sử dụng này thành GB tháng: 36.900.000 GB giờ/720 giờ mỗi tháng trong tháng 4 = 51.250 GB tháng.
Giá của Amazon Redshift Spectrum
Amazon Redshift Spectrum cho phép bạn chạy trực tiếp các truy vấn SQL trên hàng exabyte dữ liệu trong Amazon S3. Bạn phải trả phí cho số lượng byte được Redshift Spectrum quét, làm tròn đến megabyte kế tiếp, với mức tối thiểu là 10 MB mỗi truy vấn. Các câu lệnh Ngôn ngữ định nghĩa dữ liệu (DDL) như CREATE/ALTER/DROP TABLE để quản lý phân vùng và truy vấn không thành công sẽ không bị tính phí.
Các truy vấn Amazon Redshift Serverless đối với dữ liệu bên ngoài trong Amazon S3 không được tính phí riêng mà bao gồm trong chi phí thanh toán Amazon Redshift Serverless tính theo số RPU giờ.
Bạn có thể cải thiện hiệu năng truy vấn và giảm chi phí bằng cách lưu trữ dữ liệu theo định dạng nén, phân vùng và chia cột. Nếu bạn nén dữ liệu bằng một trong các định dạng được hỗ trợ của Redshift Spectrum, chi phí của bạn sẽ giảm xuống do có ít dữ liệu được quét hơn. Tương tự, nếu bạn lưu trữ dữ liệu theo định dạng chia cột như Apache Parquet hay Optimized Row Columnar (ORC), chi phí của bạn sẽ giảm xuống do Redshift Spectrum chỉ quét các cột mà truy vấn cần.
Với Redshift Spectrum, bạn sẽ bị tính phí cho mỗi terabyte dữ liệu được quét, làm tròn đến megabyte kế tiếp, với mức tối thiểu 10 MB mỗi truy vấn. Ví dụ: nếu quét 10 GB dữ liệu, bạn sẽ bị tính phí 0,05 USD. Nếu quét 1 TB dữ liệu, bạn sẽ bị tính phí 5,00 USD.
Phụ phí
Bạn phải trả phí cho cụm Amazon Redshift được sử dụng để truy vấn dữ liệu với Redshift Spectrum. Redshift Spectrum truy vấn dữ liệu trực tiếp trong Amazon S3. Bạn phải trả mức giá S3 tiêu chuẩn để lưu trữ các đối tượng trong các bộ chứa S3 của bạn và cho các yêu cầu được thực hiện đối với các bộ chứa S3 của bạn. Để biết thông tin chi tiết, vui lòng tham khảo phần mức giá Amazon S3.
Nếu sử dụng AWS Glue Data Catalog với Amazon Redshift Spectrum, bạn sẽ được tính mức giá AWS Glue Data Catalog tiêu chuẩn. Để biết thông tin chi tiết, vui lòng tham khảo giá của AWS Glue.
Khi sử dụng Amazon Redshift Spectrum để truy vấn dữ liệu đã mã hóa của AWS Key Management Service (KMS) trong Amazon S3, bạn sẽ bị tính mức phí AWS KMS tiêu chuẩn. Để biết thông tin chi tiết, vui lòng tham khảo giá của AWS KMS.
Ví dụ về giá của Redshift Spectrum dựa trên mức giá tại miền Đông Hoa Kỳ (Bắc Virginia)
Ví dụ: chúng ta có một bảng gồm 100 cột có kích thước bằng nhau được lưu trữ trong Amazon S3 dưới dạng tệp văn bản không nén, tổng kích thước là 4 TB. Việc chạy truy vấn lấy dữ liệu từ một cột duy nhất của bảng sẽ yêu cầu Redshift Spectrum quét toàn bộ tệp, do không thể phân tách các định dạng văn bản. Truy vấn này sẽ quét 4 TB và có chi phí 20 USD. (5 USD/TB x 4 TB = 20 USD)
Nếu nén tệp bằng GZIP, bạn sẽ thấy tỷ lệ nén 4:1. Trong trường hợp này, tệp nén của bạn sẽ có kích thước 1 TB. Redshift Spectrum vẫn phải quét toàn bộ tệp nhưng do kích thước bằng một phần tư nên bạn sẽ chỉ phải trả một phần tư chi phí, tức là 5 USD. (5 USD/TB x 1 TB = 5 USD)
Nếu bạn nén tệp và chuyển sang định dạng chia cột như Apache Parquet, bạn có thể nhìn thấy tỷ lệ nén 4:1 và kích thước tệp nén là 1 TB. Sử dụng cùng truy vấn như trên, Redshift Spectrum chỉ cần quét một cột trong tệp Parquet. Chi phí của truy vấn này sẽ là 0,05 USD. (5 USD/TB x kích thước tệp 1 TB x 1/100 cột, tức là tổng cộng 10 GB được quét = 0,05 USD)
Lưu ý: Các ví dụ tính giá bên trên chỉ nhằm mục đích minh họa. Tỷ lệ nén của các tệp và cột khác nhau có thể khác nhau.
Tính giá Thay đổi quy mô đồng thời
Amazon Redshift tự động bổ sung dung lượng tạm thời để cung cấp hiệu năng nhanh liên tục, ngay cả khi có hàng nghìn người dùng và truy vấn đồng thời. Bạn không cần quản lý tài nguyên, không cần trả trước và cũng không mất phí cho thời gian khởi động hoặc tắt các cụm tạm thời. Bạn có thể tích lũy một giờ tín dụng cụm Thay đổi quy mô đồng thời sau mỗi 24 giờ trong khi cụm chính của bạn đang chạy. Bạn phải trả phí theo nhu cầu tính trên từng giây đối với cụm Thay đổi quy mô đồng thời được sử dụng vượt quá các khoản tín dụng miễn phí – chỉ khi cụm này phục vụ các truy vấn của bạn – với mức phí tối thiểu là một phút mỗi lần kích hoạt một cụm Thay đổi quy mô đồng thời. Mức phí theo nhu cầu tính trên từng giây sẽ dựa trên loại và số lượng nút trong cụm Amazon Redshift của bạn.
Theo mặc định, Amazon Redshift phi máy chủ tự động tăng hoặc giảm quy mô tài nguyên khi cần thiết để đáp ứng nhu cầu của khối lượng công việc và không phát sinh phí riêng cho việc Điều chỉnh quy mô đồng thời.
Tín dụng Điều chỉnh quy mô đồng thời
Các cụm Redshift nhận được tối đa một giờ tín dụng Thay đổi quy mô đồng thời miễn phí mỗi ngày. Tín dụng nhận được theo giờ cho mỗi cụm hoạt động trong tài khoản AWS của bạn, và có thể sử dụng bởi cùng cụm này chỉ sau khi nhận được tín dụng. Bạn có thể tích lũy tối đa 30 giờ tín dụng Thay đổi quy mô đồng thời miễn phí cho mỗi cụm hoạt động. Tín dụng không bị hết hạn miễn là cụm của bạn không bị chấm dứt sử dụng.
Ví dụ về giá của Thay đổi quy mô đồng thời
Cụm Redshift cho nút 10 DC2.8XL ở Miền Đông Hoa Kỳ có giá 48 USD/giờ. Hãy xem xét tình huống có hai cụm tạm thời được sử dụng vượt quá năm phút so với tín dụng Thay đổi quy mô đồng thời miễn phí. Mức phí theo nhu cầu tính trên từng giây của tính năng Thay đổi quy mô đồng thời là 48 USD x 1/3600 = 0,013 USD mỗi giây. Phụ phí cho tính năng Thay đổi quy mô đồng thời trong trường hợp này là 0,013 USD mỗi giây x 300 giây x 2 cụm tạm thời = 8 USD. Do đó, tổng chi phí cho cụm Amazon Redshift và hai cụm tạm thời trong trường hợp này là 56 USD.
Tính giá Redshift ML
Khi bắt đầu sử dụng Redshift ML, bạn đủ điều kiện nhận bậc miễn phí của Amazon SageMaker nếu trước đây bạn chưa từng sử dụng Amazon SageMaker. Bậc này bao gồm hai yêu cầu CREATE MODEL miễn phí mỗi tháng trong hai tháng với tối đa 100.000 ô/yêu cầu. Bậc miễn phí của bạn bắt đầu từ tháng đầu tiên khi bạn tạo mô hình đầu tiên trong Redshift ML.
Phí dành cho Amazon S3
Yêu cầu CREATE MODEL cũng phải chịu các khoản phí nhỏ trên Amazon S3. Chi phí của S3 sẽ chỉ khoảng dưới 1 USD mỗi tháng vì dung lượng dữ liệu S3 được tạo bởi CREATE MODEL nằm trong khoảng vài gigabyte. Khi bạn bật chế độ thu gom rác, những dữ liệu này nhanh chóng bị loại bỏ. Đầu tiên, Amazon S3 được sử dụng để lưu trữ dữ liệu đào tạo do truy vấn SELECT của CREATE MODEL tạo ra. Sau đó, dịch vụ này được sử dụng để lưu trữ nhiều thành phần lạ liên quan đến mô hình cần thiết cho việc dự đoán. Chế độ thu gom rác mặc định sẽ loại bỏ cả dữ liệu đào tạo và thành phần lạ liên quan đến mô hình ở cuối CREATE MODEL.
Các phương án kiểm soát chi phí
Bạn có thể kiểm soát chi phí đào tạo bằng cách đặt MAX_CELLS. Nếu không, giá trị mặc định của MAX_CELLS là 1 triệu và trong phần lớn trường hợp, chi phí đào tạo của bạn sẽ duy trì ở mức dưới 20 USD. Khi bộ dữ liệu đào tạo vượt quá 1 triệu, giá sẽ tăng như sau:
Số ô | Giá |
10 triệu ô đầu tiên |
20 USD/1 triệu ô |
90 triệu ô tiếp theo |
15 USD/1 triệu ô |
Trên 100 triệu ô |
7 USD/1 triệu ô |
Lưu ý: Giá thực tế thường sẽ thấp hơn các giới hạn trên được chia sẻ ở phần trên.
Ví dụ về chi phí CREATE MODEL:
- 100.000 ô là 20 USD (= 1 x 20)
- 2.000.000 ô là 40 USD (= 2 x 20)
- 23.000.000 ô là 395 USD (= 10 x 20 + 13 x 15)
- 99.000.000 ô là 1.535 USD (= 10 x 20 + 89 x 15) và
- 211.000.000 ô là 2.327 USD (= 10 x 20 + 90 x 15 + 111 x 7)
Nếu dữ liệu đào tạo do truy vấn SELECT của yêu cầu CREATE MODEL tạo ra vượt quá giới hạn MAX_CELLS mà bạn đã cung cấp (hoặc theo mặc định là vượt quá 1 triệu, trong trường hợp bạn không cung cấp giới hạn), CREATE MODEL sẽ chọn ngẫu nhiên khoảng MAX_CELLS/“số cột” bản ghi từ bộ dữ liệu đào tạo và sẽ đào tạo bằng các bộ được chọn ngẫu nhiên này. Sự lựa chọn ngẫu nhiên được thiết kế để tránh sai lệch trong bộ dữ liệu đào tạo đã giảm. Do đó, bằng cách đặt MAX_CELLS, bạn có thể duy trì chi phí của mình trong giới hạn.
Tính giá Phiên bản đặt trước
Phiên bản đặt trước là sự lựa chọn thích hợp khi khối lượng công việc sản xuất có trạng thái ổn định, mang lại mức chiết khấu đáng kể so với cách tính giá theo nhu cầu cho các loại nút Amazon Redshift. Khách hàng thường mua Phiên bản đặt trước sau khi chạy thử nghiệm và chứng minh khái niệm để xác thực các cấu hình sản xuất.
Bạn có thể hưởng lợi từ khoản tiết kiệm đáng kể so với mức giá theo nhu cầu bằng cách cam kết sử dụng Amazon Redshift trong kỳ hạn một hoặc ba năm. Mức định giá Phiên bản đặt trước phụ thuộc vào loại nút được mua và duy trì hiệu lực cho đến khi kết thúc kỳ hạn đặt trước. Các loại giá đều bao gồm thêm hai bản sao dữ liệu – một bản trên các nút cụm và một bản trên Amazon S3. Chúng tôi sẽ bảo đảm khả năng sao lưu, sự bền bỉ, khả năng sử dụng, bảo mật, giám sát và bảo trì cho bạn.
Có ba phương án tính giá Phiên bản đặt trước:
Không trả trước – Bạn không cần trả trước bất kỳ chi phí nào và chỉ cam kết thanh toán chi phí theo tháng trong kỳ hạn một năm.
Trả trước một phần – Bạn trả trước một phần chi phí Phiên bản đặt trước và trả dần phần còn lại trong kỳ hạn một hoặc ba năm.
Trả trước toàn bộ – Bạn trả trước hoàn toàn chi phí cho toàn bộ kỳ hạn (một hoặc ba năm) của Phiên bản đặt trước.
Phiên bản đặt trước là khái niệm tính phí và không được sử dụng để tạo các cụm kho dữ liệu. Khi thực hiện giao dịch mua, bạn sẽ được tính phí trả trước và phí theo tháng tương ứng, ngay cả khi hiện tại bạn không chạy cụm nào hoặc nếu cụm hiện có đang tạm dừng. Để mua Phiên bản đặt trước, hãy truy cập vào tab Reserved Nodes (Nút dự trữ) trong bảng điều khiển Redshift.
Chúng tôi có thể chấm dứt chương trình giá Phiên bản đặt trước bất kỳ lúc nào. Ngoài việc chịu giá Phiên bản dự trữ, các Phiên bản dự trữ cũng chịu tất cả phí truyền dữ liệu và các phí khác được áp dụng theo Thỏa thuận khách hàng của AWS hoặc thỏa thuận khác với chúng tôi điều chỉnh việc bạn sử dụng dịch vụ của chúng tôi.
*Đây là số tiền trả trung bình mỗi tháng cho toàn bộ kỳ hạn của Phiên bản đặt trước. Mỗi tháng, tùy thuộc vào loại phiên bản Redshift bạn sử dụng, số tiền thanh toán thực sẽ bằng với số giờ thực trong tháng nhân với chi phí sử dụng theo giờ hoặc số giây trong tháng nhân với chi phí sử dụng theo giờ chia cho 3600. Mức giá sử dụng theo giờ bằng tổng số tiền thanh toán trung bình mỗi tháng cho toàn bộ kỳ hạn của Phiên bản đặt trước chia cho tổng số giờ (dựa trên một năm có 365 ngày) cho toàn bộ kỳ hạn của Phiên bản đặt trước.
** Mức định giá thực tế theo giờ giúp bạn tính toán số tiền tiết kiệm được từ Phiên bản đặt trước so với Phiên bản theo nhu cầu. Khi mua Phiên bản đặt trước, bạn sẽ phải trả phí cho từng giờ trong toàn bộ thời hạn sử dụng Phiên bản đặt trước mà bạn lựa chọn, bất kể bạn có đang chạy phiên bản đó không. Giá thực tế theo giờ cho thấy chi phí theo giờ được khấu hao của phiên bản. Đó là tổng giá thành cho toàn bộ thời hạn của Phiên bản đặt trước, bao gồm tất cả các chi phí trả trước, phân bổ cho mỗi giờ trong thời hạn của Phiên bản đặt trước.
*** Đối với Phiên bản đặt trước, bạn cộng khoản tiền trả trước vào mức phí theo giờ rồi nhân với số giờ trong kỳ hạn, rồi chia cho số năm trong kỳ hạn và số TB mỗi nút. Đối với RA3, dữ liệu lưu trong bộ lưu trữ được quản lý sẽ được tính phí riêng dựa trên dữ liệu thực tế lưu trong các loại nút RA3; giá thực tế trên mỗi TB hàng năm chỉ được tính nhằm xác định chi phí nút điện toán.
Chi phí tích hợp không ETL MỚI
Amazon Redshift tích hợp không ETL với cơ sở dữ liệu OLTP, qua đó loại bỏ nhu cầu xây dựng và quản lý các quy trình ETL. Các cơ sở dữ liệu được hỗ trợ bao gồm Amazon Aurora, Amazon DynamoDB và Amazon Relational Database Service (Amazon RDS) dành cho MySQL. Các tích hợp này cung cấp cho bạn sự linh hoạt, vì vậy bạn có thể chọn các bảng dữ liệu cụ thể trong cơ sở dữ liệu để tự động sao chép vào Amazon Redshift. Sự linh hoạt này cho phép bạn chạy phân tích thống nhất trên nhiều ứng dụng và nguồn dữ liệu. AWS không tính thêm phí cho việc tích hợp không ETL. Bạn trả tiền cho các tài nguyên hiện tại được sử dụng để tạo và xử lý dữ liệu thay đổi được tạo trong quá trình tích hợp không ETL. Điều này bao gồm lưu trữ Amazon Redshift bổ sung để lưu trữ dữ liệu được sao chép, khả năng điện toán để xử lý sao chép dữ liệu (hoặc RPU trên Amazon Redshift phi máy chủ) và chi phí truyền dữ liệu liên Khu vực để di chuyển dữ liệu từ nguồn sang mục tiêu. Dịch vụ xử lý liên tục các thay đổi dữ liệu bằng cách tích hợp không ETL được cung cấp miễn phí. Để biết thêm thông tin, hãy truy cập trang giá của Aurora, RDS dành cho MySQL và DynamoDB.
Dung lượng lưu trữ bản sao lưu
Lưu trữ sao lưu là lưu trữ gắn liền với các bản kết xuất nhanh được thực hiện cho kho dữ liệu của bạn. Việc tăng thời gian lưu giữ bản sao lưu hoặc tạo thêm bản kết xuất nhanh sẽ làm tăng dung lượng lưu trữ bản sao lưu trong kho dữ liệu của bạn. Amazon Redshift tính phí các ảnh chụp nhanh thủ công mà bạn thực hiện bằng bảng điều khiển, giao diện lập trình ứng dụng (API) hoặc giao diện dòng lệnh (CLI). Ảnh chụp nhanh tự động của Redshift là mặc định và được tạo từ tính năng lập lịch ảnh chụp nhanh của Amazon Redshift sẽ không bị tính phí và có thể được lưu giữ trong tối đa 35 ngày. Bạn không bị tính phí các điểm phục hồi Amazon Redshift phi máy chủ tồn tại dưới 24 giờ. Nếu bạn chọn giữ các điểm khôi phục trên 24 giờ, các điểm này sẽ phát sinh phí như một phần của RMS. Dữ liệu được lưu trữ trên các cụm RA3 là một phần của RMS và được tính theo mức phí RMS, nhưng các bản kết xuất nhanh thủ công cho các cụm RA3 được tính phí dung lượng bản lưu trữ sao lưu theo mức phí Amazon S3 tiêu chuẩn được nêu trên trang này.
Ví dụ: nếu cụm RA3 của bạn có 10 TB dữ liệu và 30 TB bản kết xuất nhanh thủ công, bạn sẽ được tính phí 10 TB RMS và 30 TB dung lượng lưu trữ bản sao lưu. Với các cụm điện toán mật độ cao (DC) và lưu trữ mật độ cao (DS), dung lượng lưu trữ đi kèm với cụm và không bị tính phí riêng, tuy nhiên, các bản sao lưu sẽ được lưu trữ bên ngoài, trong Amazon S3. Dung lượng lưu trữ sao lưu vượt quá dung lượng lưu trữ được cung cấp trên các cụm DC và DS bị tính phí là dung lượng lưu trữ bản sao lưu theo mức phí S3 tiêu chuẩn. Các bản kết xuất nhanh được tính phí cho đến khi hết hạn hoặc bị xóa, kể cả khi cụm bị tạm dừng hoặc bị xóa.
Truyền dữ liệu
Dữ liệu được truyền giữa Amazon Redshift và Amazon S3 trong cùng Khu vực AWS cho các hoạt động sao lưu, khôi phục, tải và dỡ tải đều miễn phí. Đối với tất các tác vụ truyền dữ liệu vào và ra khỏi Amazon Redshift khác, bạn sẽ được tính phí theo mức giá truyền dữ liệu AWS tiêu chuẩn. Cụ thể là, nếu bạn chạy cụm Amazon Redshift trong Amazon Virtual Private Cloud (VPC), bạn sẽ thấy các khoản phí truyền dữ liệu AWS tiêu chuẩn cho các tác vụ truyền dữ liệu qua JDBC/ODBC đến điểm cuối cụm Amazon Redshift của bạn. Ngoài ra, khi bạn sử dụng Enhanced VPC Routing (Định tuyến VPC tăng cường) và dỡ tải dữ liệu lên Amazon S3 ở một khu vực khác, bạn sẽ chịu thêm phí truyền dữ liệu AWS tiêu chuẩn. Để biết thêm thông tin về mức phí truyền dữ liệu của AWS, hãy xem trang về giá của Amazon Elastic Cloud Compute (Amazon EC2).
Amazon Redshift tính phí chia sẻ dữ liệu giữa các khu vực cũng như sao chép bản kết xuất nhanh giữa các khu vực. Phí chia sẻ dữ liệu được tính ở khu vực của khách hàng nơi dữ liệu đang được truy cập. Bản sao kết xuất nhanh giữa các khu vực được tính phí trong khu vực nguồn nơi tồn tại cụm đã tạo bản kết xuất nhanh. Phí truyền dữ liệu áp dụng cho tất cả các bản kết xuất nhanh (cả tự động và thủ công) và các điểm khôi phục. Mọi khoản phí truyền dữ liệu cho bản sao kết xuất nhanh chỉ dành cho dữ liệu gia tăng.
Truyền dữ liệu chia sẻ VÀO từ hoặc Truyền dữ liệu bản sao kết xuất nhanh RA từ
Ví dụ về định giá
Bạn sử dụng bốn nút ra3.xlarge và 40 TB RMS trong một tháng. Trong suốt tháng đó, bạn cũng quét 20 TB dữ liệu bằng Redshift Spectrum và quét 20 TB dữ liệu. Bạn sử dụng mức định giá theo nhu cầu.
Mức phí của bạn được tính như sau:
- Chi phí phiên bản Redshift RA3 = 4 phiên bản x 3,26 USD mỗi giờ x 730 giờ một tháng = 9.519,20 USD
- Chi phí RMS = 40 TB x 1.024 GB mỗi TB x 0,024 USD = 983,04 USD
- Chi phí Redshift Spectrum = 20 TB x 5,00 USD = 100,00 USD
Tổng chi phí hàng tháng: 10.602,24 USD
Bạn sử dụng cụm nhiều vùng sẵn sàng được triển khai đồng thời ở hai vùng sẵn sàng. Cụm của bạn có bốn nút ra3.4xlarge trên mỗi vùng sẵn sàng và bạn sử dụng 40 TB RMS trong một tháng. Bạn sử dụng mức định giá theo nhu cầu.
Mức phí của bạn được tính như sau:
- Chi phí phiên bản Redshift RA3 cho AZ1 = 4 phiên bản x 3,26 USD mỗi giờ x 730 giờ một tháng = 9.519,20 USD
- Chi phí phiên bản Redshift RA3 cho AZ2 = 4 phiên bản x 3,26 USD mỗi giờ x 730 giờ một tháng = 9.519,20 USD
- Chi phí RMS = 40 TB x 1.024 GB mỗi TB x 0,024 USD = 983,04 USD
Tổng chi phí hàng tháng: 20.021,44 USD
Giả định rằng bạn có tác vụ xử lý dữ liệu cần được thực hiện mỗi giờ, từ 7 giờ sáng đến 7 giờ tối, trên kho dữ liệu Amazon Redshift tại Khu vực miền Đông Hoa Kỳ (Bắc Virginia). Để đơn giản, giả định rằng mỗi lần chạy tác vụ cần một khoảng thời gian như nhau là 10 phút 30 giây. Giả sử Amazon Redshift sử dụng công suất 128 RPU để chạy tác vụ.
Bảng dưới đây tóm tắt tổng mức sử dụng trong ngày.
Khoảng thời gian truy vấn |
Tác vụ chạy 13 lần trong khoảng thời gian từ 7 giờ sáng đến 7 giờ tối, mỗi lần mất 10 phút 30 giây = 136 phút và 30 giây = 8190 giây |
Dung lượng đã sử dụng |
128 RPU |
Phí theo ngày |
109,20 USD ((8190 x 128 RPU x 0,375 USD/RPU giờ) /3600) |
Giả sử rằng bạn có ứng dụng bảng điều khiển trên kho dữ liệu Amazon Redshift tại khu vực miền Đông Hoa Kỳ (Bắc Virginia). Ứng dụng này được nhiều người dùng trong tổ chức (như nhà phân tích dữ liệu, nhà phát triển và nhà khoa học dữ liệu) sử dụng, cũng như có các khoảng thời gian cao điểm và thấp điểm trong ngày. Cụ thể, ứng dụng tăng mạnh về hoạt động người dùng từ 9 giờ sáng đến 11 giờ trưa và từ 2 giờ chiều đến 4 giờ chiều. khi hầu hết người dùng đều thực hiện phân tích và truy cập dữ liệu từ kho dữ liệu. Giả sử từ 11 giờ trưa đến 2 giờ chiều có bốn lần trong ứng dụng không có hoạt động của người dùng, mỗi lần 15 phút. Người dùng cũng không có hoạt động nào từ 10 giờ tối đến 5 giờ sáng.
Bây giờ, chúng ta hãy xem mức sử dụng tài nguyên trên kho dữ liệu Amazon Redshift. Giả sử rằng để kiểm soát tốt hơn tỷ lệ giá/hiệu năng, bạn đã cài đặt cấu hình Cơ bản của Amazon Redshift Serverless là 64 RPU. Giả sử rằng trong khoảng thời gian cao điểm vào buổi sáng và buổi chiều, Amazon Redshift tự động mở rộng quy mô và sử dụng tổng công suất lần lượt là 192 RPU và 128 RPU.
Bảng dưới đây tóm tắt tổng mức sử dụng trong ngày.
Khung thời gian |
Tổng thời gian thực hiện truy vấn |
5 giờ sáng – 9 giờ sáng |
64 RPU trong 4 giờ = 64 x 4= 256 RPU giờ |
9 giờ sáng – 11 giờ trưa |
192 RPU trong 2 giờ = 384 RPU giờ |
11 giờ trưa – 2 giờ chiều |
Không kể bốn lần không có hoạt động trong 15 phút, thời gian hoạt động là 2 giờ. 64 RPU trong 2 giờ = 64 x 2= 128 RPU giờ |
2 giờ chiều – 3 giờ chiều |
128 RPU trong 1 giờ = 128 RPU giờ |
3 giờ chiều – 10 giờ tối |
64 RPU trong 7 giờ = 64 x 7= 448 RPU giờ |
10 giờ tối – 5 giờ sáng |
Không hoạt động |
Phí theo ngày |
504 USD ((256+384+128+128+448) x 0,375 USD/RPU giờ) |
Một cụm Redshift cho nút 10 DC2.8XL ở miền Đông Hoa Kỳ có giá 48 USD/giờ. Hãy xem xét tình huống có hai cụm tạm thời được sử dụng vượt quá năm phút so với tín dụng Thay đổi quy mô đồng thời miễn phí. Mức phí theo nhu cầu tính trên từng giây của tính năng Thay đổi quy mô đồng thời là 48 USD x 1/3600 = 0,013 USD mỗi giây. Phụ phí cho tính năng Thay đổi quy mô đồng thời trong trường hợp này là 0,013 USD mỗi giây x 300 giây x 2 cụm tạm thời = 8 USD. Do đó, tổng chi phí của cụm Redshift và hai cụm tạm thời là 56 USD.
Ví dụ: chúng ta có một bảng gồm 100 cột có kích thước bằng nhau được lưu trữ trong Amazon S3 dưới dạng tệp văn bản không nén, tổng kích thước là 4 TB. Việc chạy truy vấn lấy dữ liệu từ một cột duy nhất của bảng sẽ yêu cầu Redshift Spectrum quét toàn bộ tệp, do không thể phân tách các định dạng văn bản. Dựa trên mức giá Redshift Spectrum cho miền Đông Hoa Kỳ (Bắc Virginia), truy vấn này sẽ quét 4 TB với chi phí 20 USD. (5,00 USD/TB x 4 TB = 20 USD)
Nếu nén tệp bằng GZIP, bạn sẽ thấy tỷ lệ nén 4:1. Trong trường hợp này, tệp nén của bạn sẽ có kích thước 1 TB. Redshift Spectrum vẫn phải quét toàn bộ tệp nhưng do kích thước bằng một phần tư nên bạn sẽ chỉ phải trả một phần tư chi phí, tức là 5 USD. (5 USD/TB x 1 TB = 5 USD)
Nếu bạn nén tệp và chuyển sang định dạng chia cột như Apache Parquet, bạn có thể nhìn thấy tỷ lệ nén 4:1 và kích thước tệp nén là 1 TB. Sử dụng cùng truy vấn như trên, Redshift Spectrum chỉ cần quét một cột trong tệp Parquet. Chi phí của truy vấn này sẽ là 0,05 USD. (5 USD/TB x kích thước tệp 1 TB x 1/100 cột, tức là tổng cộng 10 GB được quét = 0,05 USD).
Lưu ý: Các ví dụ tính giá bên trên chỉ nhằm mục đích minh họa. Tỷ lệ nén của các tệp và cột khác nhau có thể khác nhau.
Tài nguyên định giá khác
Dễ dàng tính phí hằng tháng của bạn với AWS
Liên hệ với các chuyên gia AWS để được báo giá riêng
Khám phá thêm các tài nguyên Amazon Redshift