Tính năng của Amazon Redshift – Kho lưu trữ dữ liệu đám mây

Amazon Redshift tăng tốc thời gian nhận thông tin chuyên sâu bằng tính năng lưu kho dữ liệu trên đám mây nhanh chóng, dễ dàng, bảo mật và trên quy mô lớn.

Tính năng và lợi ích

Mỗi năm, chúng tôi cung cấp hàng trăm tính năng và cải tiến sản phẩm, dựa trên các trường hợp sử dụng và phản hồi của khách hàng. Tìm hiểu thêm về tính năng mới.

Giúp mọi người dễ dàng phân tích

Tập trung vào việc nhanh chóng chuyển từ dữ liệu sang thông tin chuyên sâu và mang lại kết quả kinh doanh mà không cần lo quản lý kho dữ liệu.

Amazon Redshift Serverless: Amazon Redshift Serverless là một lựa chọn phi máy chủ của Amazon Redshift, giúp bạn dễ dàng chạy và thay đổi quy mô phân tích chỉ trong vài giây mà không cần thiết lập và quản lý cơ sở hạ tầng kho dữ liệu. Với Redshift Serverless, bất kỳ người dùng nào – bao gồm cả nhà phân tích dữ liệu, nhà phát triển, chuyên gia kinh doanh và nhà khoa học dữ liệu – đều có thể lấy thông tin chuyên sâu từ dữ liệu mà chỉ cần tải và truy vấn dữ liệu trong kho dữ liệu. Tìm hiểu thêm.

Trình soạn thảo truy vấn phiên bản 2: Sử dụng SQL để giúp các nhà phân tích dữ liệu, kỹ sư dữ liệu và những người dùng SQL khác dễ tiếp cận dữ liệu và hồ dữ liệu Amazon Redshift của bạn hơn với khu vực làm việc trên web dành cho nhà phân tích để khám phá và phân tích dữ liệu. Trình soạn thảo truy vấn phiên bản 2 giúp bạn trực quan hóa kết quả truy vấn chỉ bằng một cú nhấp chuột, tạo lược đồ và bảng, tải dữ liệu một cách trực quan và duyệt tìm đối tượng của cơ sở dữ liệu. Công cụ này cũng cung cấp một trình soạn thảo trực quan để tạo và chia sẻ các truy vấn SQL, hoạt động phân tích, kết quả trực quan hóa và chú thích, đồng thời chia sẻ an toàn với nhóm của bạn.

Thiết kế bảng tự động: Amazon Redshift theo dõi khối lượng công việc của người dùng và sử dụng các thuật toán phức tạp để tìm cách cải thiện bố cục vật lý của dữ liệu nhằm tối ưu hóa tốc độ truy vấn. Tính năng Tối ưu hóa bảng tự động chọn các khóa sắp xếp và phân phối tốt nhất để tối ưu hóa hiệu năng cho khối lượng công việc của cụm. Nếu Amazon Redshift xác định rằng việc áp dụng khóa sẽ cải thiện hiệu năng cụm thì các bảng sẽ tự động được thay đổi mà không cần sự can thiệp của quản trị viên. Các tính năng bổ sung như Xóa chân không tự động, Sắp xếp bảng tự động và Phân tích tự động giúp loại bỏ nhu cầu bảo trì và điều chỉnh thủ công đối với các cụm Redshift để có được hiệu năng tốt nhất cho các cụm và khối lượng công việc sản xuất mới.

Truy vấn bằng công cụ của riêng bạn: Amazon Redshift cung cấp cho bạn sự linh hoạt để chạy truy vấn trong bảng điều khiển hoặc kết nối các công cụ máy khách SQL, thư viện hoặc các công cụ khoa học dữ liệu như Amazon Quicksight, Tableau, PowerBI, QueryBook và Jupyter Notebook.

API đơn giản để tương tác với Amazon Redshift: Amazon Redshift giúp bạn dễ dàng truy cập dữ liệu với tất cả các loại ứng dụng theo sự kiện và ứng dụng dựa trên dịch vụ web phi máy chủ, dù là truyền thống, trong bộ chứa hay hoạt động trên đám mây. API Dữ liệu của Amazon Redshift đơn giản hóa việc truy cập, thu nạp và xuất dữ liệu từ các ngôn ngữ lập trình và nền tảng được SDK AWS hỗ trợ như Python, Go, Java, Node.js, PHP, Ruby và C ++. API Dữ liệu loại bỏ nhu cầu cấu hình trình điều khiển và quản lý kết nối cơ sở dữ liệu. Thay vào đó, bạn có thể chạy các lệnh SQL tới cụm Amazon Redshift đơn giản bằng cách gọi điểm cuối API bảo mật do API Dữ liệu cung cấp. API dữ liệu quản lý các kết nối cơ sở dữ liệu và dữ liệu đệm. API dữ liệu không đồng bộ, do đó bạn có thể truy xuất kết quả sau này. Kết quả truy vấn của bạn được lưu trữ trong 24 giờ.

Khả năng chịu lỗi: Có nhiều tính năng giúp cải thiện độ tin cậy cho cụm kho dữ liệu của bạn. Ví dụ: Amazon Redshift liên tục theo dõi tình trạng của cụm và tự động sao chép lại dữ liệu từ các ổ đĩa bị hỏng và thay thế nút khi cần để đảm bảo khả năng chịu lỗi. Các cụm cũng có thể được chuyển đến các Vùng sẵn sàng (AZ) thay thế mà không làm mất dữ liệu hoặc thay đổi ứng dụng.

Phân tích tất cả dữ liệu của bạn

Sở hữu thông tin chuyên sâu tích hợp theo thời gian thực và nội dung phân tích mang tính dự đoán về các dữ liệu phức tạp, quy mô lớn của bạn trong các cơ sở dữ liệu hoạt động, hồ dữ liệu, kho dữ liệu và hàng nghìn bộ dữ liệu của bên thứ ba.

Truy vấn liên kết: Với khả năng truy vấn liên kết mới trong Amazon Redshift, bạn có thể truy cập vào cơ sở dữ liệu quan hệ dành cho hoạt động của mình. Truy vấn dữ liệu trực tiếp trên một hoặc nhiều cơ sở dữ liệu Amazon Relational Database Service (RDS) và Aurora PostgreSQL cũng như cơ sở dữ liệu RDS MySQL và Aurora MySQL để quan sát tức thì một cách đầy đủ các hoạt động kinh doanh mà không cần di chuyển dữ liệu. Bạn có thể kết nối dữ liệu từ kho dữ liệu Redshift, dữ liệu trong hồ dữ liệu và cả dữ liệu trong các kho lưu trữ hoạt động của bạn để đưa ra quyết định chính xác hơn dựa trên các dữ liệu đó. Amazon Redshift cung cấp các giải pháp tối ưu hóa tinh vi để giảm việc di chuyển dữ liệu qua mạng, cộng thêm việc xử lý dữ liệu song song hàng loạt để đảm bảo các truy vấn hiệu năng cao. Tìm hiểu thêm.

Truy vấn và xuất dữ liệu đến và đi từ hồ dữ liệu của bạn: Không kho dữ liệu đám mây nào khác có thể giúp bạn thực hiện cả tính năng truy vấn dữ liệu và ghi dữ liệu trở lại hồ dữ liệu ở định dạng mở dễ dàng như vậy. Bạn có thể truy vấn các định dạng tệp mở như Parquet, ORC, JSON, Avro, CSV và nhiều định dạng khác ngay trong S3 bằng cách sử dụng SQL ANSI quen thuộc. Để xuất dữ liệu sang hồ dữ liệu, chỉ cần sử dụng câu lệnh UNLOAD của Amazon Redshift trong dòng mã SQL và chỉ định Parquet là định dạng tệp, Amazon Redshift sẽ tự động xử lý việc định dạng dữ liệu và di chuyển dữ liệu vào S3. Điều này cho phép bạn dễ dàng lưu trữ dữ liệu có cấu trúc được tổ chức khoa học, thường xuyên được truy cập cũng như dữ liệu cấu trúc chưa hoàn chỉnh trong kho dữ liệu Amazon Redshift, đồng thời theo kịp hàng exabyte dữ liệu có cấu trúc, cấu trúc chưa hoàn chỉnh và không cấu trúc trong Amazon S3. Việc xuất dữ liệu từ Amazon Redshift trở lại hồ dữ liệu của bạn giúp bạn phân tích dữ liệu sâu hơn nữa với các dịch vụ AWS như Amazon Athena, Amazon EMR và Amazon SageMaker.

Các tích hợp dịch vụ AWS: Tích hợp tận gốc với các dịch vụ AWS, cơ sở dữ liệu và dịch vụ máy học giúp bạn xử lý các quy trình phân tích hoàn chỉnh dễ dàng hơn mà không gặp khó khăn. Ví dụ: AWS Lake Formation là một dịch vụ giúp bạn dễ dàng thiết lập hồ dữ liệu an toàn trong vài ngày. AWS Glue có thể trích xuất, chuyển đổi và tải dữ liệu (ETL) vào Amazon Redshift. Amazon Kinesis Data Firehose là cách dễ nhất để nắm bắt, chuyển đổi và tải dữ liệu truyền vào Amazon Redshift để thực hiện phân tích gần thời gian thực. Bạn có thể sử dụng Amazon EMR để xử lý dữ liệu bằng Hadoop/Spark và tải kết quả vào Amazon Redshift để hỗ trợ BI và phân tích. Amazon QuickSight là dịch vụ BI đầu tiên có giá thanh toán theo từng phiên mà bạn có thể sử dụng để tạo báo cáo, hình ảnh trực quan hóa và bảng thông tin trên dữ liệu Redshift. Bạn có thể sử dụng Amazon Redshift để chuẩn bị dữ liệu chạy các khối lượng công việc máy học (ML) với Amazon SageMaker. Để tăng tốc độ di chuyển sang Amazon Redshift, bạn có thể sử dụng AWS Schema Conversion tool và AWS Database Migration Service (DMS). Amazon Redshift cũng được tích hợp sâu với Amazon Key Management Service (KMS) và Amazon CloudWatch để bảo mật, theo dõi và tuân thủ. Bạn cũng có thể sử dụng hàm do người dùng xác định (UDF) trong Lambda để gọi một hàm Lambda từ các truy vấn SQL giống như khi gọi UDF trong Amazon Redshift. Bạn có thể ghi UDF Lambda để tích hợp với các dịch vụ của Đối tác AWS và truy cập vào các dịch vụ AWS phổ biến khác như Amazon DynamoDB và Amazon SageMaker.

Tích hợp bảng điều khiển đối tác: Bạn có thể đẩy nhanh quá trình triển khai dữ liệu và tạo thông tin chi tiết có giá trị về doanh nghiệp trong vài phút bằng cách tích hợp với một số giải pháp của Đối tác trong bảng điều khiển Amazon Redshift. Với những giải pháp này, bạn có thể đưa dữ liệu từ các ứng dụng như Salesforce, Google Analytics, Facebook Ads, Slack, Jira, Splunk và Marketo vào kho dữ liệu Redshift của mình một cách hiệu quả và hợp lý. Tính năng này cũng giúp bạn kết hợp các bộ dữ liệu khác nhau này và phân tích chúng cùng với nhau để tạo ra thông tin chuyên sâu có ích.

Chia sẻ dữ liệu:Tính năng chia sẻ dữ liệu của Amazon Redshift cho phép bạn nâng cao mức độ dễ sử dụng, hiệu năng và lợi ích chi phí của Amazon Redshift khi triển khai từ một cụm đến nhiều cụm mà vẫn có thể chia sẻ dữ liệu. Việc chia sẻ dữ liệu hỗ trợ truy cập dữ liệu tức thì, chi tiết và nhanh chóng trên các cụm Redshift mà không cần sao chép hoặc di chuyển. Tính năng chia sẻ dữ liệu cho phép truy cập trực tiếp vào dữ liệu để người dùng của bạn luôn thấy thông tin nhất quán và mới nhất, ngay khi cập nhật trong kho dữ liệu. Bạn có thể chia sẻ dữ liệu trực tiếp một cách an toàn với các cụm Redshift trong cùng hoặc khác tài khoản AWS và trên khắp các Khu vực. Tìm hiểu thêm.

AWS Data Exchange cho Amazon Redshift: Truy vấn bộ dữ liệu Amazon Redshift từ cụm Redshift của riêng bạn mà không cần trích xuất, chuyển đổi và tải (ETL) dữ liệu. Bạn có thể đăng ký sử dụng các sản phẩm kho dữ liệu đám mây Redshift trong AWS Data Exchange. Ngay sau khi nhà cung cấp thực hiện cập nhật, khách đăng ký sẽ nhìn thấy sự thay đổi. Nếu bạn là nhà cung cấp dữ liệu, quyền truy cập sẽ tự động được cấp khi gói đăng ký bắt đầu và thu hồi khi gói đăng ký kết thúc, hóa đơn được tạo tự động khi đến hạn thanh toán và các khoản thanh toán được thu qua AWS. Bạn có thể cấp phép truy cập vào các tệp phẳng, dữ liệu trong Amazon Redshift và dữ liệu được phân phối thông qua các API, tất cả chỉ với một gói đăng ký duy nhất. Tìm hiểu thêm.

Redshift ML: Redshift ML giúp các nhà phân tích dữ liệu, nhà khoa học dữ liệu, chuyên gia BI và nhà phát triển dễ dàng tạo, đào tạo và triển khai các mô hình Amazon SageMaker bằng SQL. Với Redshift ML, bạn có thể sử dụng các lệnh SQL để tạo và đào tạo các mô hình Amazon SageMaker trên dữ liệu của mình trong Amazon Redshift rồi sử dụng các mô hình đó cho các dự đoán như phát hiện rời bỏ, dự báo tài chính, cá nhân hóa và chấm điểm rủi ro ngay trong các truy vấn và báo cáo của bạn. Tìm hiểu thêm.

Hỗ trợ gốc cho phân tích nâng cao: Amazon Redshift hỗ trợ các kiểu dữ liệu vô hướng tiêu chuẩn như NUMBER, VARCHAR và DATETIME cũng như hỗ trợ gốc cho các hoạt động xử lý phân tích nâng cao sau đây:

Xử lý dữ liệu không gian: Amazon Redshift cung cấp kiểu dữ liệu đa hình GEOMETRY nhằm hỗ trợ nhiều hình dạng hình học như Point, Linestring và Polygon. Amazon Redshift cũng cung cấp các hàm SQL không gian để xây dựng các hình dạng hình học, nhập, xuất, truy cập và xử lý dữ liệu không gian. Bạn có thể thêm các cột GEOMETRY vào bảng Redshift và viết các truy vấn SQL trên dữ liệu không gian cũng như phi không gian. Khả năng này giúp bạn lưu trữ, truy xuất và xử lý dữ liệu không gian, cũng như liên tục cải thiện thông tin kinh doanh chuyên sâu bằng cách tích hợp dữ liệu không gian vào các truy vấn phân tích của bạn. Với khả năng của Amazon Redshift trong việc truy vấn liền mạch hồ dữ liệu, bạn cũng có thể dễ dàng mở rộng việc xử lý không gian ra hồ dữ liệu bằng cách tích hợp bảng bên ngoài trong truy vấn không gian. Hãy xem tài liệu để biết thêm chi tiết.
Bản nháp HyperLogLog: HyperLogLog là một thuật toán mới giúp ước tính hiệu quả số lượng gần đúng các giá trị riêng biệt trong một bộ dữ liệu. Bản nháp HLL là một cấu trúc đóng gói thông tin về các giá trị riêng biệt trong bộ dữ liệu. Bạn có thể sử dụng bản nháp HLL để đạt được lợi ích hiệu năng đáng kể cho các truy vấn tính toán số liệu gần đúng trên các bộ dữ liệu lớn, với sai số tương đối trung bình trong khoảng 0,01 – 0,6%. Amazon Redshift cung cấp kiểu dữ liệu hạng nhất HLLSKETCH và các hàm SQL liên quan để tạo, duy trì và kết hợp các bản nháp HyperLogLog. Khả năng HyperLogLog của Amazon Redshift sử dụng kỹ thuật khắc phục sai lệch và cung cấp độ chính xác cao với mức chiếm dụng bộ nhớ thấp. Hãy xem tài liệu để biết thêm chi tiết.
Kiểu dữ liệu DATE và TIME: Amazon Redshift cung cấp nhiều kiểu dữ liệu DATE, TIME, TIMETZ, TIMESTAMP và TIMESTAMPTZ để lưu trữ và xử lý dữ liệu/dữ liệu thời gian ngay tại gốc. Kiểu TIME và TIMESTAMP lưu trữ dữ liệu thời gian mà không có thông tin múi giờ, còn kiểu TIMETZ và TIMESTAMPTZ lưu trữ dữ liệu thời gian bao gồm cả thông tin múi giờ. Bạn có thể sử dụng các hàm SQL ngày/giờ khác nhau để xử lý các giá trị ngày và giờ trong các truy vấn Redshift. Hãy xem tài liệu để biết thêm chi tiết.
Xử lý dữ liệu cấu trúc chưa hoàn chỉnh: Kiểu dữ liệu SUPER của Amazon Redshift lưu trữ dữ liệu JSON và dữ liệu cấu trúc chưa hoàn chỉnh khác trong các bảng Redshift ngay tại gốc và sử dụng ngôn ngữ truy vấn PartiQL để xử lý liền mạch dữ liệu cấu trúc chưa hoàn chỉnh. Kiểu dữ liệu SUPER có bản chất là không cần lược đồ và cho phép lưu trữ các giá trị lồng nhau có thể chứa các giá trị vô hướng Redshift, dữ liệu mảng lồng nhau và cấu trúc lồng nhau. PartiQL là một phần mở rộng của SQL, cung cấp các khả năng truy vấn mạnh mẽ như điều hướng đối tượng và dữ liệu mảng, hủy lồng ghép mảng, nhập động và ngữ nghĩa không cần lược đồ. Công cụ này giúp bạn phân tích nâng cao, kết hợp dữ liệu SQL có cấu trúc cổ điển và dữ liệu SUPER cấu trúc chưa hoàn chỉnh với hiệu năng vượt trội, tính linh hoạt và khả năng sử dụng dễ dàng. Hãy xem tài liệu để biết thêm chi tiết.
Tích hợp với các công cụ của bên thứ ba: Có nhiều tùy chọn để nâng cao Amazon Redshift bằng cách hợp tác với các công cụ và chuyên gia hàng đầu trong ngành để tải, chuyển đổi và trực quan hóa dữ liệu. Một danh sách dài các Đối tác của chúng tôi đã chứng nhận các giải pháp của họ đều tương thích với Amazon Redshift.
- Tải và chuyển đổi dữ liệu với Đối tác tích hợp dữ liệu.
- Phân tích dữ liệu và chia sẻ thông tin chuyên sâu trên khắp tổ chức với Đối tác nghiệp vụ thông minh.
- Xây dựng và triển khai nền tảng phân tích với Đối tác tư vấn và tích hợp hệ thống.
- Truy vấn, khám phá và mô hình hóa dữ liệu bằng cách sử dụng các công cụ và tiện ích từ Đối tác truy vấn và mô hình hóa dữ liệu.

Hiệu quả ở mọi quy mô

Tỷ lệ hiệu năng trên giá tăng đến 3 lần so với các kho dữ liệu đám mây khác, với khả năng tối ưu hóa tự động để cải thiện tốc độ truy vấn.

Các phiên bản RA3: Các phiên bản RA3 mang lại tỷ lệ hiệu năng trên giá cao gấp đến 3 lần so với bất kỳ dịch vụ kho dữ liệu đám mây nào. Các phiên bản Amazon Redshift này tối đa hóa tốc độ cho khối lượng công việc yêu cầu hiệu năng cao, đòi hỏi năng lực điện toán lớn, với tính linh hoạt để thanh toán riêng cho điện toán, độc lập với dung lượng lưu trữ bằng cách chỉ định số lượng phiên bản bạn cần. Tìm hiểu thêm.

Lưu trữ hiệu quả và xử lý truy vấn với hiệu năng cao: Amazon Redshift cho hiệu năng truy vấn nhanh trên các bộ dữ liệu có dung lượng từ vài gigabyte đến hàng petabyte. Định dạng lưu trữ theo cột, phương thức nén dữ liệu và bản đồ vùng giúp giảm lượng I/O cần đến để thực hiện truy vấn. Cùng với các mã hóa tiêu chuẩn ngành như LZO và Zstandard, Amazon Redshift cũng cung cấp mã hóa nén chuyên dụng AZ64 cho các kiểu số và ngày/giờ để vừa giúp tiết kiệm dung lượng lưu trữ lại vừa mang đến hiệu năng truy vấn tối ưu.

Tính đồng thời không giới hạn: Amazon Redshift cung cấp hiệu năng nhanh ổn định, thậm chí khi có hàng nghìn truy vấn đồng thời, cho dù người dùng truy vấn dữ liệu trong kho dữ liệu Redshift hay trực tiếp từ hồ dữ liệu Amazon S3 của bạn. Tính năng Thay đổi quy mô đồng thời trong Amazon Redshift hỗ trợ nhiều người dùng đồng thời và nhiều truy vấn đồng thời hầu như không giới hạn với chất lượng dịch vụ nhất quán nhờ việc thêm dung lượng tạm thời trong vài giây khi hoạt động đồng thời tăng. Tìm hiểu thêm.

Chế độ xem cụ thể hóa: Các chế độ xem cụ thể hóa của Amazon Redshift giúp đạt hiệu năng truy vấn nhanh hơn đáng kể cho các khối lượng công việc phân tích lặp lại hoặc có thể dự đoán như tổng hợp bảng thông tin, truy vấn từ các công cụ Nghiệp vụ thông minh (BI) cũng như tác vụ xử lý trích xuất, chuyển đổi và tải (ELT) dữ liệu. Bạn có thể sử dụng các chế độ xem cụ thể hóa để dễ dàng lưu trữ và quản lý các kết quả được tính toán sẵn từ một câu lệnh SELECT có thể tham chiếu đến một hoặc nhiều bảng, bao gồm cả các bảng bên ngoài. Các truy vấn tiếp sau tham chiếu đến chế độ xem cụ thể hóa có thể chạy nhanh hơn nhiều nhờ việc tái sử dụng những kết quả được tính toán sẵn này. Amazon Redshift có thể duy trì ngày càng hiệu quả các chế độ xem cụ thể hóa để tiếp tục mang lại các lợi ích về hiệu năng với độ trễ thấp. Tìm hiểu thêm.

Chế độ xem cụ thể hóa tự động: Các tổ chức đang xây dựng thêm ứng dụng, bảng điều khiển, báo cáo và truy vấn tùy biến phụ thuộc vào dữ liệu nhiều hơn bao giờ hết. Mỗi ứng dụng cần được điều chỉnh và tối ưu hóa, đòi hỏi thời gian, tài nguyên và tiền bạc. Chế độ xem cụ thể hóa là công cụ mạnh mẽ giúp cải thiện hiệu năng truy vấn và bạn có thể thiết lập công cụ này khi có khối lượng công việc được hiểu rõ. Tuy nhiên, có thể bạn đã tăng và thay đổi khối lượng công việc có các mẫu truy vấn không thể dự đoán trước. Chế độ xem cụ thể hóa tự động cải thiện thông lượng truy vấn, giảm độ trễ truy vấn, rút ngắn thời gian thực thi thông qua khả năng tự động làm mới, tự động viết lại truy vấn, làm mới tăng dần và giám sát liên tục các cụm Amazon Redshift. Amazon Redshift cân bằng việc tạo và quản lý các Chế độ xem cụ thể hóa tự động (Automated Materialized View, AutoMV) với khả năng sử dụng tài nguyên ở mức tối thiểu. Tìm hiểu thêm.

Áp dụng máy học để tối đa hóa thông lượng và hiệu năng: Các chức năng ML nâng cao trong Amazon Redshift mang lại thông lượng và hiệu năng cao, ngay cả với khối lượng công việc khác nhau hoặc hoạt động đồng thời của người dùng. Amazon Redshift sử dụng các thuật toán tinh vi để dự đoán và phân loại các truy vấn đến dựa trên thời gian chạy và yêu cầu về tài nguyên của các truy vấn đó nhằm quản lý linh hoạt hiệu năng và tính đồng thời, cũng như giúp bạn ưu tiên những khối lượng công việc quan trọng của doanh nghiệp mình. Tính năng Tăng tốc truy vấn ngắn (SQA) gửi các truy vấn ngắn từ các ứng dụng như bảng thông tin đến hàng đợi nhanh để xử lý ngay lập tức thay vì bị bỏ lại phía sau các truy vấn lớn. Tính năng Quản lý khối lượng công việc tự động (WLM) sử dụng ML để quản lý linh hoạt bộ nhớ và tính đồng thời, giúp tối đa hóa thông lượng truy vấn. Ngoài ra, giờ đây bạn có thể dễ dàng đặt mức độ ưu tiên của các truy vấn quan trọng nhất, ngay cả khi hàng trăm truy vấn đang được gửi. Amazon Redshift cũng là một hệ thống tự học, luôn quan sát khối lượng công việc của người dùng, xác định cơ hội cải thiện hiệu năng khi mức sử dụng tăng lên, áp dụng trơn tru các giải pháp tối ưu hóa và đưa ra khuyến nghị thông qua Redshift Advisor khi cần một hành động rõ ràng của người dùng để tăng hiệu năng Redshift hơn nữa.

Lưu kết quả vào bộ nhớ đệm: Amazon Redshift sử dụng tính năng lưu kết quả vào bộ nhớ đệm để phản hồi trong chưa đầy một giây cho các truy vấn lặp lại. Bảng thông tin, hình ảnh trực quan hóa và các công cụ nghiệp vụ thông minh chạy truy vấn lặp lại đều tăng hiệu năng đáng kể. Khi có truy vấn chạy, Amazon Redshift tìm kiếm trong bộ nhớ đệm xem có kết quả đã lưu từ lần chạy trước hay không. Nếu tìm thấy kết quả được lưu trong bộ nhớ đệm và dữ liệu chưa thay đổi, kết quả lưu trong bộ nhớ đệm sẽ được trả về ngay lập tức thay vì chạy lại truy vấn.

Lưu kho dữ liệu quy mô petabyte: Với vài cú nhấp chuột trong bảng điều khiển hoặc với một lệnh gọi API đơn giản, bạn có thể dễ dàng thay đổi số lượng hoặc loại nút mạng trong kho dữ liệu và tăng/giảm quy mô dữ liệu khi nhu cầu thay đổi. Với dung lượng lưu trữ được quản lý, dung lượng được thêm tự động để hỗ trợ khối lượng công việc lên tới 8 PB dữ liệu nén. Bạn cũng có thể chạy truy vấn đối với hàng petabyte dữ liệu trong Amazon S3 mà không phải tải hoặc chuyển đổi bất kỳ dữ liệu nào với tính năng Amazon Redshift Spectrum. Bạn có thể sử dụng S3 như một hồ dữ liệu có tính sẵn sàng cao, an toàn và tiết kiệm chi phí để lưu trữ dữ liệu không giới hạn ở các định dạng dữ liệu mở. Redshift Spectrum chạy truy vấn trên hàng nghìn nút mạng song song để cho kết quả nhanh, bất kể mức độ phức tạp của truy vấn hoặc lượng dữ liệu.

Các tùy chọn tính giá linh hoạt: Amazon Redshift là kho dữ liệu tiến kiệm chi phí nhất và bạn có thể tối ưu hóa cách thức thanh toán. Bạn có thể bắt đầu với số tiền nhỏ từ 0,25 USD mỗi giờ mà không cần cam kết và tăng lên chỉ với 1,000 USD/terabyte/năm. Amazon Redshift là kho dữ liệu đám mây duy nhất cung cấp phương thức tính giá theo nhu cầu mà không cần phí trả trước, giá Phiên bản đặt trước có thể giúp bạn tiết kiệm tới 75% bằng cách cam kết theo kỳ hạn một hoặc ba năm và giá theo mỗi truy vấn dựa trên lượng dữ liệu được quét trong hồ dữ liệu Amazon S3 của bạn. Giá của Amazon Redshift bao gồm bảo mật tích hợp, nén dữ liệu, lưu trữ dự phòng và truyền dữ liệu. Khi dung lượng dữ liệu tăng lên, bạn sử dụng bộ nhớ được quản lý trong các phiên bản RA3 để lưu trữ dữ liệu thật tiết kiệm với giá 0,024 USD/GB/tháng.

Chi phí có thể dự đoán được, ngay cả với khối lượng công việc khó đoán trước: Amazon Redshift cho phép bạn thay đổi quy mô với tác động chi phí tối thiểu, vì mỗi cụm kiếm được tới một giờ tín dụng Thay đổi quy mô đồng thời miễn phí mỗi ngày. Những tín dụng miễn phí này đủ cho nhu cầu về tính đồng thời của 97% khách hàng. Điều này cung cấp cho bạn khả năng dự đoán chi phí hàng tháng, ngay cả trong thời gian nhu cầu phân tích biến động.

Chọn loại nút của bạn để có được giá trị tốt nhất cho khối lượng công việc: Bạn có thể chọn một trong ba loại phiên bản để tối ưu hóa Amazon Redshift cho nhu cầu lưu kho dữ liệu của mình: nút RA3, nút Điện toán mật độ cao và nút Lưu trữ mật độ cao.

Các nút RA3 giúp bạn thay đổi quy mô lưu trữ độc lập với điện toán. Với RA3, bạn có được kho dữ liệu hiệu năng cao, giúp lưu trữ dữ liệu trong một lớp lưu trữ riêng biệt. Bạn chỉ cần thay đổi kích thước kho dữ liệu cho phù hợp hiệu năng truy vấn mà bạn cần.

Các nút Điện toán mật độ cao (DC) cho phép bạn tạo kho dữ liệu có hiệu năng rất cao bằng CPU tốc độ cao, RAM dung lượng lớn và ổ đĩa thể rắn (SSD), là sự lựa chọn tốt nhất cho ít hơn 500 GB dữ liệu.

Các nút Lưu trữ mật độ cao (DS2) giúp bạn tạo kho dữ liệu lớn bằng ổ đĩa cứng (HDD) với mức giá thấp khi bạn mua các Phiên bản đặt trước có thời gian sử dụng ba năm. Hầu hết khách hàng chạy trên các cụm DS2 có thể di chuyển khối lượng công việc sang cụm RA3, cũng như đạt được hiệu năng gấp hai lần và nhiều dung lượng lưu trữ hơn với cùng chi phí như DS2.

Việc thay đổi quy mô cụm hoặc chuyển đổi giữa các loại nút chỉ yêu cầu thực hiện một lệnh gọi API hoặc vài cú nhấp chuột trên Bảng điều khiển quản lý AWS. Để biết thêm thông tin, vui lòng truy cập trang giá.

Bảo mật và tuân thủ nhất

AWS có khả năng bảo mật toàn diện để đáp ứng các yêu cầu khắt khe nhất và Amazon Redshift tích hợp hệ thống bảo mật dữ liệu vượt trội mà không mất thêm chi phí.

Mã hóa hoàn chỉnh: Với chỉ vài thao tác thiết lập thông số, bạn có thể cài đặt Amazon Redshift sử dụng SSL để bảo mật dữ liệu khi truyền cũng như mã hóa AES-256 được tăng tốc bằng phần cứng đối với dữ liệu đang lưu trữ. Nếu bạn chọn kích hoạt tính năng mã hóa dữ liệu đang lưu trữ, toàn bộ dữ liệu ghi vào ổ đĩa cũng như mọi bản sao lưu đều sẽ được mã hóa. Amazon Redshift tiến hành quản lý khóa theo mặc định.

Cách ly mạng: Amazon Redshift giúp bạn cấu hình quy tắc tường lửa để kiểm soát truy cập qua mạng đến cụm kho dữ liệu của bạn. Bạn có thể chạy Amazon Redshift trong Amazon Virtual Private Cloud (VPC) để cách ly cụm kho dữ liệu trong mạng ảo riêng của bạn và kết nối đến cơ sở hạ tầng CNTT hiện có thông qua VPN IPsec được mã hóa theo tiêu chuẩn ngành.

Kiểm tra và tuân thủ: Amazon Redshift tích hợp với AWS CloudTrail để bạn có thể kiểm tra tất cả các lệnh gọi API Redshift. Redshift cũng ghi nhật ký mọi thao tác SQL, bao gồm cả các lượt kết nối, truy vấn và các thay đổi trong kho dữ liệu của bạn. Bạn có thể truy cập các nhật ký này bằng cách sử dụng truy vấn SQL trên bảng hệ thống hoặc lưu nhật ký vào một vị trí an toàn trong Amazon S3. Amazon Redshift tuân thủ các yêu cầu SOC1, SOC2, SOC3 và PCI DSS cấp 1. Để biết thêm thông tin chi tiết, hãy truy cập vào phần Tính tuân thủ của Đám mây AWS.

Token hóa: Các hàm do người dùng xác định (UDF) của Amazon Lambda giúp bạn sử dụng hàm AWS Lambda làm UDF trong Amazon Redshift và gọi hàm từ các truy vấn Redshift SQL. Với chức năng này, bạn có thể viết các phần mở rộng tùy chỉnh cho truy vấn SQL của mình để đạt được sự tích hợp chặt chẽ hơn với các dịch vụ khác hoặc các sản phẩm của bên thứ ba. Bạn có thể viết UDF Lambda để kích hoạt token hóa bên ngoài, che chắn dữ liệu, nhận dạng hoặc loại bỏ khả năng nhận dạng dữ liệu bằng cách tích hợp với các nhà cung cấp như Protegrity, cũng như bảo vệ hoặc ngừng bảo vệ dữ liệu nhạy cảm dựa trên quyền và nhóm của người dùng, trong thời gian truy vấn.

Kiểm soát truy cập chi tiết: Kiểm soát bảo mật hàng và cột chi tiết đảm bảo người dùng chỉ nhìn thấy dữ liệu mà họ có quyền truy cập. Amazon Redshift được tích hợp với AWS Lake Formation, đảm bảo các biện pháp kiểm soát truy cập vào của Lake Formation cũng được thực hiện cho các truy vấn Redshift trên dữ liệu trong hồ dữ liệu.

Tìm hiểu thêm về tính năng mới.

Truy cập Tài liệu Amazon Redshift để biết thêm thông tin chi tiết về sản phẩm.

Tìm hiểu thêm về giá của Amazon Redshift

Truy cập trang giá

Bạn đã sẵn sàng xây dựng chưa?

Bắt đầu sử dụng Amazon Redshift

Bạn có thêm thắc mắc?

Hãy liên hệ chúng tôi

Tính năng Amazon Redshift

Tính năng và lợi ích

Giúp mọi người dễ dàng phân tích

Phân tích tất cả dữ liệu của bạn

Hiệu quả ở mọi quy mô

Bảo mật và tuân thủ nhất

Ngừng hỗ trợ cho Internet Explorer