Amazon EMR phi máy chủ hiện đã hỗ trợ Apache Spark 4.0.1 (xem trước)

Ngày đăng: 21 Th11 2025

Amazon EMR phi máy chủ hiện đã hỗ trợ Apache Spark 4.0.1 (xem trước). Với Spark 4.0.1, bạn có thể xây dựng và duy trì các quy trình dữ liệu dễ dàng hơn với các loại dữ liệu ANSI SQL và VARIANT, củng cố các khung tuân thủ và quản trị với định dạng bảng Apache Iceberg v3 và triển khai các ứng dụng thời gian thực mới nhanh hơn với khả năng truyền phát trực tuyến nâng cao. Điều này cho phép đội ngũ của bạn giảm nợ kỹ thuật và tái thực hiện nhanh hơn, nhưng vẫn đảm bảo tính chính xác và nhất quán của dữ liệu.

Với Spark 4.0.1, bạn sẽ có thể xây dựng quy trình dữ liệu bằng ANSI SQL tiêu chuẩn, giúp cho nhóm người dùng lớn hơn không biết các loại ngôn ngữ lập trình như Python hoặc Scala cũng có thể truy cập được. Spark 4.0.1 hỗ trợ nguyên bản dữ liệu JSON và bán cấu trúc thông qua các loại dữ liệu VARIANT, đem đến sự linh hoạt trong việc xử lý các định dạng dữ liệu đa dạng. Bạn có thể củng cố khả năng tuân thủ và quản trị thông qua định dạng bảng Apache Iceberg v3, cung cấp mục đảm bảo giao tác và theo dõi quá trình dữ liệu của bạn thay đổi theo thời gian, tạo ra biên bản kiểm tra bạn cần để đáp ứng yêu cầu quy định. Bạn sẽ có thể triển khai ứng dụng thời gian thực nhanh hơn bằng các biện pháp kiểm soát truyền phát trực tuyến được cải thiện cho bạn quyền quản lý thao tác theo trạng thái phức tạp cũng như giám sát các tác vụ truyền phát trực tuyến dễ dàng hơn. Với khả năng này, bạn sẽ có khả năng hỗ trợ các trường hợp sử dụng như phát hiện gian lận và cá nhân hóa thời gian thực.

Apache Spark 4.0.1 được cung cấp ở chế độ xem trước ở tất cả các khu vực có cung cấp EMR phi máy chủ, ngoại trừ khu vực Trung Quốc và AWS GovCloud (Hoa Kỳ). Để tìm hiểu thêm về Apache Spark 4.0.1 trên Amazon EMR, hãy truy cập Thông báo phát hành Amazon EMR phi máy chủ hoặc bắt đầu sử dụng bằng cách tạo ứng dụng EMR bằng Spark 4.0.1 từ Bảng điều khiển quản lý AWS.