Amazon EMR công bố S3A làm bộ kết nối mặc định
AWS công bố Amazon EMR S3A, một bộ kết nối Amazon S3 mới giúp tối ưu hóa hiệu suất cho khối lượng công việc Apache Hadoop, Apache Spark và Apache Hive trên Amazon EMR. Bộ kết nối mới này tăng cường kiến trúc S3A nguồn mở với các phần tối ưu hóa riêng cho AWS để các tổ chức có thể xử lý dữ liệu quy mô lớn hiệu quả hơn. Với sự hỗ trợ tích hợp trực tiếp cho S3 Express One Zone, S3 Glacier và AWS Outposts, EMR S3A giúp khách hàng vận dụng các tùy chọn lưu trữ khác nhau trong AWS để tối ưu hóa cả tốc độ truy cập dữ liệu và chi phí lưu trữ trên khối lượng công việc EMR của họ.
Ngoài ra, bộ kết nối EMR S3A còn mang đến các tính năng bảo mật nâng cao và khả năng thực hiện vượt ra ngoài S3A nguồn mở. Những điểm cải tiến chính bao gồm: hỗ trợ kiểm soát truy cập chi tiết tích hợp trong Apache Spark, trình phân giải thông tin chứng thực S3A nâng cao, MagicCommitter V2 cho lệnh ghi tệp được tối ưu hóa và danh mục tiền tố S3 tăng tốc cho các định dạng tệp dạng cột. Những điểm cải tiến này khả dụng từ bản phát hành EMR 7.10 và duy trì khả năng tương thích với các ứng dụng hiện có.
Bộ kết nối Amazon EMR S3A được cung cấp ở tất cả các Khu vực AWS có Amazon EMR và được định cấu hình sẵn với Amazon EMR phiên bản phát hành 7.10 trở lên. Để tìm hiểu thêm về Amazon EMR S3A, hãy xem tài liệu về Amazon EMR.