- Phân tích›
- Amazon Redshift›
- Các tính năng của Amazon Redshift
Tính năng của Amazon Redshift
Cung cấp hiệu năng giá chưa từng có ở quy mô lớn với SQL cho hồ dữ liệu của bạn
Chủ đề trang
- Đạt được hiệu suất giá, khả năng điều chỉnh quy mô và bảo mật vượt trội
12
- Khai phá thông tin chuyên sâu với SQL trên dữ liệu hợp nhất trong hồ dữ liệu
4
- Đẩy nhanh quá trình ra quyết định với phân tích gần thời gian thực
4
- Nhận phân tích SQL dễ dàng mà không cần quản lý cơ sở hạ tầng
4
- Tạo ngữ cảnh cho các ứng dụng và tăng năng suất của người dùng với AI tạo sinh
3
Đạt được hiệu suất giá, khả năng điều chỉnh quy mô và bảo mật vượt trội
Mở tất cảCác phiên bản RA3 tối đa hóa tốc độ cho khối lượng công việc yêu cầu hiệu năng cao, đòi hỏi năng lực điện toán lớn, với tính linh hoạt để thanh toán riêng cho điện toán, độc lập với dung lượng lưu trữ bằng cách chỉ định số lượng phiên bản bạn cần.
Định dạng lưu trữ theo cột, phương thức nén dữ liệu và bản đồ vùng giúp giảm lượng I/O cần đến để thực hiện truy vấn. Cùng với các mã hóa tiêu chuẩn ngành như LZO và Zstandard, Amazon Redshift cũng cung cấp mã hóa nén chuyên dụng AZ64 cho các kiểu số và ngày/giờ để vừa giúp tiết kiệm dung lượng lưu trữ lại vừa mang đến hiệu năng truy vấn tối ưu.
Hỗ trợ nhiều người dùng cùng một lúc và nhiều truy vấn cùng một lúc với số lượng gần như không giới hạn và chất lượng dịch vụ nhất quán nhờ việc thêm dung lượng tạm thời trong vài giây khi tính đồng thời tăng lên. Điều chỉnh quy mô với tác động tối thiểu lên chi phí, vì mỗi cụm nhận được tới một giờ tín dụng Điều chỉnh quy mô đồng thời miễn phí mỗi ngày. Những tín dụng miễn phí này đủ cho nhu cầu về tính đồng thời của 97% khách hàng.
Bắt đầu ghi vào cơ sở dữ liệu Redshift từ các kho dữ liệu Redshift khác chỉ trong vài cú nhấp chuột, tạo điều kiện hơn nữa cho việc cộng tác dữ liệu, điều chỉnh quy mô điện toán linh hoạt cho khối lượng công việc ETL/xử lý dữ liệu bằng cách thêm các kho thuộc nhiều loại và kích cỡ khác nhau dựa trên nhu cầu về tỷ lệ giá/hiệu năng. Trải nghiệm tính minh bạch cao hơn trong việc sử dụng điện toán vì mỗi kho được tính phí theo mức điện toán của riêng kho đó, giúp giữ chi phí của bạn trong tầm kiểm soát.
Các chế độ xem cụ thể hóa của Amazon Redshift cho phép bạn đạt được hiệu năng truy vấn nhanh hơn đáng kể đối với các khối lượng công việc phân tích lặp lại hoặc có thể dự đoán như tổng hợp bảng thông tin, truy vấn từ các công cụ nghiệp vụ thông minh (BI) cũng như tác vụ xử lý trích xuất, chuyển đổi và tải (ETL) dữ liệu. Bạn có thể sử dụng các chế độ xem cụ thể hóa để dễ dàng lưu trữ và quản lý các kết quả được tính toán sẵn từ một câu lệnh SELECT có thể tham chiếu đến một hoặc nhiều bảng, bao gồm hồ dữ liệu, zero-ETL và các bảng chia sẻ dữ liệu. Với tính năng làm mới gia tăng, Amazon Redshift xác định các thay đổi trong bảng cơ sở hoặc các bảng xảy ra sau lần làm mới trước đó và chỉ cập nhật các bản ghi tương ứng trong chế độ xem cụ thể hóa. Làm mới gia tăng chạy nhanh hơn so với làm mới đầy đủ và cải thiện hiệu suất khối lượng công việc.
Cung cấp thời gian phản hồi dưới một giây cho các truy vấn trùng lặp. Bảng thông tin, hình ảnh trực quan hóa và các công cụ nghiệp vụ thông minh chạy truy vấn trùng lặp đều tăng hiệu năng đáng kể. Khi có truy vấn chạy, Amazon Redshift tìm kiếm trong bộ nhớ đệm xem có kết quả đã lưu từ lần chạy trước hay không. Nếu tìm thấy kết quả được lưu trong bộ nhớ đệm và dữ liệu chưa thay đổi, kết quả lưu trong bộ nhớ đệm sẽ được trả về ngay lập tức thay vì chạy lại truy vấn.
Một cơ chế sắp xếp dạng bảng mạnh mẽ mới giúp cải thiện hiệu năng của các truy vấn lặp đi lặp lại bằng cách tự động sắp xếp dữ liệu dựa trên các bộ lọc truy vấn đến (ví dụ: Doanh số trong một khu vực cụ thể). Phương pháp này tăng tốc đáng kể hiệu năng của các lần quét bảng so với các phương pháp truyền thống.
Mở rộng khả năng khôi phục bằng cách giảm thời gian khôi phục và đảm bảo khả năng tự động khôi phục mà không làm mất dữ liệu. Kho dữ liệu cho nhiều vùng sẵn sàng của Amazon Redshift sẽ tối đa hóa hiệu suất và giá trị bằng cách cung cấp tính khả dụng cao mà không cần phải sử dụng tài nguyên dự phòng, nâng tính khả dụng lên mức 99,99% SLA.
Amazon Redshift giúp bạn cấu hình quy tắc tường lửa để kiểm soát truy cập qua mạng đến cụm kho dữ liệu của bạn. Bạn có thể chạy Amazon Redshift trong Amazon Virtual Private Cloud (Amazon VPC) để cách ly cụm kho dữ liệu trong mạng ảo riêng của bạn và kết nối đến cơ sở hạ tầng CNTT hiện có thông qua VPN IPsec được mã hóa theo tiêu chuẩn ngành.
Với chỉ một vài thiết lập thông số, bạn có thể cài đặt cho Amazon Redshift sử dụng TSL để bảo mật dữ liệu đang được truyền và sử dụng mã hóa AES-256 được tăng tốc bằng phần cứng đối với dữ liệu đang được lưu trữ. Nếu bạn chọn kích hoạt tính năng mã hóa dữ liệu đang lưu trữ, toàn bộ dữ liệu ghi vào ổ đĩa cũng như mọi bản sao lưu đều sẽ được mã hóa. Amazon Redshift tiến hành quản lý khóa theo mặc định.
Tích hợp với Trung tâm nhận dạng IAM cho phép các tổ chức hỗ trợ truyền bá danh tính đáng tin cậy giữa Amazon Redshift, Amazon QuickSight và AWS Lake Formation. Khách hàng có thể sử dụng danh tính tổ chức của mình để truy cập Amazon Redshift trong trải nghiệm đăng nhập đơn bằng cách sử dụng nhà cung cấp danh tính (IdP) bên thứ ba, chẳng hạn như Microsoft Entra ID, Okta, Ping, OneLogin, v.v. từ Amazon QuickSight và Trình soạn thảo truy vấn của Amazon Redshift. Quản trị viên có thể sử dụng người dùng và nhóm của nhà cung cấp danh tính bên thứ ba để quản lý quyền truy cập ở mức độ chi tiết vào dữ liệu trên các dịch vụ và kiểm tra quyền truy cập cấp độ người dùng trong AWS CloudTrail. Với khả năng truyền danh tính đáng tin cậy, danh tính của người dùng được truyền liền mạch giữa Amazon QuickSight, Amazon Redshift và Lake Formation, qua đó giảm thời gian thu thập thông tin chuyên sâu và cho trải nghiệm phân tích không gián đoạn.
Các biện pháp kiểm soát bảo mật cấp hàng và cột chi tiết đảm bảo rằng người dùng chỉ nhìn thấy dữ liệu mà họ có quyền truy cập. Amazon Redshift được tích hợp với Lake Formation, đảm bảo các biện pháp kiểm soát truy cập cấp cột của Lake Formation cũng được thực hiện cho các truy vấn Redshift trên dữ liệu trong hồ dữ liệu. Tính năng chia sẻ dữ liệu của Amazon Redshift hỗ trợ việc kiểm soát quyền truy cập tập trung ở cùng một nơi bằng cách dùng Lake Formation để đơn giản hóa việc quản trị dữ liệu được chia sẻ từ Amazon Redshift. Lake Formation là một dịch vụ giúp bạn dễ dàng thiết lập các hồ dữ liệu an toàn, quản lý tập trung quyền truy cập chi tiết vào dữ liệu trên tất cả các dịch vụ sử dụng dữ liệu, đồng thời áp dụng các quyền kiểm soát cấp hàng và cấp cột. Với che mặt nạ dữ liệu động, bảo vệ dữ liệu nhạy cảm của bạn bằng cách giới hạn mức độ dữ liệu nhận dạng hiển thị cho người dùng. Xác định nhiều cấp độ quyền hạn trên các trường này để những người dùng và nhóm khác nhau có thể có các mức truy cập dữ liệu khác nhau mà không cần phải tạo nhiều bản sao dữ liệu, tất cả thông qua giao diện SQL quen thuộc của Amazon Redshift.
Khai phá thông tin chuyên sâu với SQL trên dữ liệu hợp nhất trong hồ dữ liệu
Mở tất cả
Phân tích tất cả dữ liệu thống nhất của bạn bằng SQL với tích hợp Amazon Redshift với hồ chứa trong Amazon SageMaker. Truy vấn dữ liệu Amazon Simple Storage Service (Amazon S3) ở định dạng mở, loại bỏ chuyển động dữ liệu giữa hồ và kho. Mở dữ liệu Amazon Redshift của bạn trong hồ của SageMaker để cho phép truy cập trên các công cụ phân tích AWS và Apache Iceberg, hỗ trợ phân tích dữ liệu toàn diện và học máy (ML).
Amazon Redshift hỗ trợ truy vấn chỉ đọc sử dụng ANSI SQL quen thuộc trên các định dạng bảng Apache Iceberg, Apache Hudi và Delta Lake và truy vấn các định dạng tệp mở bao gồm Apache Parquet, ORC, Avro, JSON và CSV trực tiếp trong Amazon S3. Apache Iceberg là một ví dụ về định dạng bảng mã nguồn mở cung cấp tính nhất quán giao dịch và tổ chức nâng cao các hồ dữ liệu thông qua cấu trúc bảng của nó. Amazon Redshift Spectrum cho phép bạn đọc từ các bảng và dữ liệu ở định dạng dữ liệu mở như Parquet, trong hồ dữ liệu của bạn trong khi vẫn giữ tối đa exabyte dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc trong Amazon S3. Bạn cũng có thể xuất dữ liệu sang hồ dữ liệu của mình bằng lệnh DỠ TẢI của Amazon Redshift, bao gồm tùy chọn xuất sang Parquet. Việc xuất dữ liệu từ Amazon Redshift trở lại hồ dữ liệu của bạn giúp bạn phân tích dữ liệu sâu hơn nữa với các dịch vụ AWS như Amazon Athena, Amazon EMR và Amazon SageMaker.
Sử dụng SQL để giúp các nhà phân tích dữ liệu, kỹ sư dữ liệu và những người dùng SQL khác dễ tiếp cận dữ liệu và hồ dữ liệu Amazon Redshift của bạn hơn với khu vực làm việc trên web dành cho nhà phân tích để khám phá và phân tích dữ liệu. Trình soạn thảo truy vấn giúp bạn trực quan hóa kết quả truy vấn chỉ trong một bước đơn giản, tạo lược đồ và bảng, tải dữ liệu một cách trực quan và duyệt tìm đối tượng của cơ sở dữ liệu. Công cụ này cũng cung cấp một trình soạn thảo trực quan để tạo và chia sẻ các truy vấn SQL, hoạt động phân tích, kết quả trực quan hóa và chú thích, đồng thời chia sẻ an toàn với nhóm của bạn.
Sử dụng trình soạn thảo SQL tích hợp được cung cấp bởi Amazon Redshift trong Studio Hợp nhất SageMaker, một môi trường phát triển dữ liệu và AI, để truy vấn dữ liệu được lưu trữ trong hồ dữ liệu, kho dữ liệu, cơ sở dữ liệu và ứng dụng.
Đẩy nhanh quá trình ra quyết định với phân tích gần thời gian thực
Mở tất cả
Tích hợp không có mã giữa Aurora, Amazon Relational Database Service (Amazon RDS), Amazon DynamoDB, các ứng dụng doanh nghiệp và Amazon Redshift cho phép phân tích và ML ngay lập tức trên petabyte dữ liệu trên cơ sở dữ liệu và ứng dụng. Ví dụ: đối với dữ liệu được ghi vào các nguồn ứng dụng hoạt động, giao dịch hoặc doanh nghiệp, các tích hợp không ETL của Aurora với Amazon Redshift liền mạch giúp dữ liệu sẵn có trong Amazon Redshift, giảm thiểu nhu cầu xây dựng và duy trì các đường ống dữ liệu ETL phức tạp.
Đơn giản hóa và tự động hóa việc tải nhập dữ liệu từ Amazon S3, qua đó giảm thời gian và công sức cần thiết để xây dựng các giải pháp tùy chỉnh hoặc quản lý các dịch vụ của bên thứ ba. Nhờ có tính năng này, Amazon Redshift giúp bạn không phải liên tục và tự mình chạy quy trình sao chép bằng cách tự động hóa việc tải nhập tệp và đảm nhận các bước tải dữ liệu liên tục một cách chi tiết. Việc hỗ trợ tính năng tự động sao chép giúp người dùng doanh nghiệp và nhà phân tích dữ liệu chưa có bất kỳ kiến thức gì về kỹ thuật dữ liệu có thể dễ dàng tạo quy tắc tải nhập và định cấu hình cho vị trí dữ liệu mà họ muốn tải từ Amazon S3.
Sử dụng SQL (Ngôn ngữ truy vấn có cấu trúc) để kết nối và tải nhập trực tiếp dữ liệu từ Luồng dữ liệu Amazon Kinesis và Dịch vụ truyền được quản lý của Amazon dành cho Apache Kafka (Amazon MSK). Tính năng Tải nhập nội dung truyền phát trực tuyến của Amazon Redshift cũng giúp bạn dễ dàng tạo và quản lý các quy trình ở hạ nguồn hơn bằng cách cho phép bạn tạo các chế độ xem cụ thể hóa ngay trên các luồng. Các chế độ xem cụ thể hóa cũng có thể bao gồm các phép biến đổi SQL nằm trong quy trình ELT (Trích xuất Tải Chuyển đổi) của bạn. Bạn có thể tự làm mới các chế độ xem cụ thể hóa đã xác định để truy vấn dữ liệu phát trực tuyến gần đây nhất.
Truy vấn dữ liệu trực tiếp trên một hoặc nhiều phiên bản Amazon RDS, bao gồm Phiên bản tương thích với Amazon Aurora PostgreSQL, Cơ sở dữ liệu Quan hệ Amazon (Amazon RDS) cho MySQL và cơ sở dữ liệu Phiên bản tương thích Amazon Aurora MySQL, để có được khả năng hiển thị ngay lập tức về các hoạt động kinh doanh đầy đủ mà không yêu cầu di chuyển dữ liệu.
Nhận phân tích SQL dễ dàng mà không cần quản lý cơ sở hạ tầng
Mở tất cả
Chạy các phân tích trong vài giây và điều chỉnh quy mô mà không cần thiết lập và quản lý cơ sở hạ tầng kho dữ liệu. Công nghệ tối ưu hóa và mở rộng quy mô dựa trên AI cho phép Amazon Redshift Serverless tự động và chủ động cung cấp và mở rộng dung lượng kho dữ liệu, mang lại hiệu suất nhanh cho ngay cả những khối lượng công việc đòi hỏi khắt khe nhất. Hệ thống sử dụng các kỹ thuật AI để tìm hiểu các mẫu khối lượng công việc của khách hàng trên các phương diện chính, chẳng hạn như truy vấn đồng thời, độ phức tạp của truy vấn, dòng khối lượng dữ liệu tăng đột biến và các mẫu ETL. Sau đó, hệ thống liên tục điều chỉnh các nguồn tài nguyên trong suốt cả ngày và áp dụng các biện pháp tối ưu hóa hiệu quả phù hợp. Bạn có thể đặt mục tiêu hiệu năng mong muốn và kho dữ liệu sẽ tự động điều chỉnh quy mô để duy trì hiệu năng nhất quán.
Các thuật toán tinh vi dự đoán và phân loại các truy vấn đến dựa trên thời gian chạy và yêu cầu về tài nguyên của các truy vấn đó để quản lý linh hoạt hiệu năng và tính đồng thời, cũng như giúp bạn ưu tiên những khối lượng công việc quan trọng của doanh nghiệp mình. Tính năng Tăng tốc truy vấn ngắn (SQA) gửi các truy vấn ngắn từ các ứng dụng như bảng thông tin đến hàng đợi nhanh để xử lý ngay lập tức thay vì bị bỏ lại phía sau các truy vấn lớn. Tính năng Quản lý khối lượng công việc tự động (WLM) sử dụng ML để quản lý linh hoạt bộ nhớ và tính đồng thời, giúp tối đa hóa thông lượng truy vấn. Ngoài ra, giờ đây bạn có thể dễ dàng đặt mức độ ưu tiên của các truy vấn quan trọng nhất, ngay cả khi hàng trăm truy vấn đang được gửi. Amazon Redshift Advisor đưa ra các khuyến nghị khi cần một thao tác rõ ràng của người dùng để tăng cường hiệu năng của Redshift hơn nữa. Đối với khối lượng công việc linh hoạt không thể dự đoán được mẫu truy vấn, chế độ xem cụ thể hóa tự động sẽ cải thiện thông lượng truy vấn, giảm độ trễ truy vấn, rút ngắn thời gian thực thi thông qua khả năng tự động làm mới, tự động viết lại truy vấn, làm mới tăng dần và giám sát liên tục các cụm Amazon Redshift. Tính năng Tối ưu hóa bảng tự động chọn các khóa sắp xếp và phân phối tốt nhất để tối ưu hóa hiệu năng cho khối lượng công việc của cụm. Nếu Amazon Redshift xác định rằng việc áp dụng khóa sẽ cải thiện hiệu năng cụm thì các bảng sẽ tự động được thay đổi mà không cần sự can thiệp của quản trị viên. Các tính năng bổ sung như xóa chân không tự động, sắp xếp bảng tự động và phân tích tự động giúp loại bỏ nhu cầu bảo trì và điều chỉnh thủ công đối với các cụm Amazon Redshift để có được hiệu năng tốt nhất cho các cụm và khối lượng công việc sản xuất mới.
Sử dụng API đơn giản để tương tác với Amazon Redshift: Amazon Redshift giúp bạn dễ dàng truy cập dữ liệu với tất cả các loại ứng dụng theo sự kiện và ứng dụng dựa trên dịch vụ web phi máy chủ, dù là truyền thống, trong bộ chứa hay hoạt động trên đám mây. API Dữ liệu của Amazon Redshift đơn giản hóa việc truy cập, thu nạp và xuất dữ liệu từ các ngôn ngữ lập trình và nền tảng được SDK AWS hỗ trợ như Python, Go, Java, Node.js, PHP, Ruby và C ++. API Dữ liệu loại bỏ nhu cầu cấu hình trình điều khiển và quản lý kết nối cơ sở dữ liệu. Thay vào đó, bạn có thể chạy các lệnh SQL tới cụm Amazon Redshift đơn giản bằng cách gọi điểm cuối API bảo mật do API Dữ liệu cung cấp. API dữ liệu quản lý các kết nối cơ sở dữ liệu và dữ liệu đệm. API dữ liệu không đồng bộ, do đó bạn có thể truy xuất kết quả sau này. Kết quả truy vấn của bạn được lưu trữ trong 24 giờ.
Chạy truy vấn trong bảng điều khiển hoặc kết nối các công cụ máy khách SQL, thư viện hoặc công cụ khoa học dữ liệu bao gồm QuickSight, Tableau, Microsoft Power BI, Alteryx, Querybook, Jupyter Notebook, Informatica, dbt, MicroStrategy và Looker.
Tạo ngữ cảnh cho các ứng dụng và tăng năng suất của người dùng với AI tạo sinh
Mở tất cảSử dụng tiếng Anh đơn giản để viết các truy vấn trong Trình soạn thảo truy vấn của Amazon Redshift để tạo các đề xuất mã SQL chính xác một cách an toàn trong phạm vi quyền truy cập dữ liệu của bạn.
Amazon Redshift tích hợp liền mạch với Amazon Bedrock, cho phép thực hiện các khả năng AI tạo sinh trực tiếp thông qua các lệnh SQL tiêu chuẩn. Sự tích hợp này cho phép các nhóm dữ liệu sử dụng các mô hình nền tảng như Anthropic Claude và Amazon Titan cho các tác vụ như phân tích văn bản, dịch thuật và phát hiện cảm xúc mà không cần thêm phức hợp cơ sở hạ tầng. Người dùng có thể liên tục chạy các mô hình AI trong quy trình phân tích dữ liệu hiện có của họ, thay đổi cách trích xuất thông tin chi tiết từ dữ liệu doanh nghiệp.
Amazon Redshift ML giúp nhà phân tích dữ liệu, nhà khoa học dữ liệu, chuyên gia BI và nhà phát triển dễ dàng tạo, đào tạo và triển khai các mô hình SageMaker bằng SQL hơn. Với Amazon Redshift ML, bạn có thể sử dụng các lệnh SQL để tạo và đào tạo các mô hình Amazon SageMaker trên dữ liệu của mình trong Amazon Redshift rồi sử dụng các mô hình đó cho các dự đoán như phát hiện rời bỏ, dự báo tài chính, cá nhân hóa và chấm điểm rủi ro ngay trong các truy vấn và báo cáo của bạn. Đưa các mô hình ngôn ngữ lớn vào Amazon Redshift cho các tác vụ xử lý ngôn ngữ tự nhiên nâng cao như tóm tắt văn bản, trích xuất thực thể và phân tích tình cảm, để có được thông tin chi tiết sâu hơn từ dữ liệu của bạn bằng SQL.