Amazon EMR

Dễ dàng chạy và thay đổi quy mô Apache Spark, Hive, Presto, và các khối lượng công việc dữ liệu lớn khác

Đơn giản hóa việc quản lý nhờ cung cấp cụm nhanh chóng, thay đổi quy mô được quản lý và cài đặt phần mềm tự động.

Phát triển, hiển thị trực quan và gỡ lỗi các ứng dụng dữ liệu lớn bằng EMR Studio.

Bảo mật dữ liệu và tài nguyên của bạn thông quan các quyền có thể tùy chỉnh trong AWS Identity and Access Management (IAM), AWS Lake Formation và Apache Ranger.

Chạy các ứng dụng dữ liệu lớn và phân tích ở quy mô petabyte nhanh hơn, với chi phí thấp hơn một nửa so với các giải pháp tại chỗ.

Cách thức hoạt động

Amazon EMR là một nền tảng xử lý, phân tích và ứng dụng nhanh chóng công nghệ máy học (ML) vào dữ liệu lớn bằng cách sử dụng các khung mã nguồn mở.
product-page-diagram_Amazon-EMR_Diagram-V5
 Nhấp vào để phóng to

Trường hợp sử dụng

Xây dựng đường ống dữ liệu có thể thay đổi quy mô

Trích xuất dữ liệu từ nhiều nguồn khác nhau, xử lý theo quy mô và cung cấp dữ liệu cho cả ứng dụng cũng như người dùng. Tận dụng các tính năng của Apache Hudi cho các hồ dữ liệu ở quy mô petabyte.

Tăng tốc khoa học dữ liệu bằng ML

Sử dụng các khung ML mã nguồn mở, chẳng hạn như Apache Spark MLlib, TensorFlow và Apache MXNet được tích hợp sẵn với EMR. Kết nối với SageMaker Studio để thực hiện phân tích, báo cáo và đào tạo mô hình.

Xử lý các luồng dữ liệu theo thời gian thực

Phân tích sự kiện từ các nguồn dữ liệu phát trực tiếp theo thời gian thực để tạo những đường ống dữ liệu phát trực tiếp lâu bền, có độ sẵn sàng cao cùng khả năng chịu lỗi.

Truy vấn bất kỳ tập dữ liệu nào


Truy vấn tập dữ liệu từ các kho lưu trữ dữ liệu khác nhau, bao gồm kho lưu trữ đối tượng, cơ sở dữ liệu quan hệ, cơ sở dữ liệu NoSQL, v.v. bằng cách sử dụng các công cụ SQL mã nguồn mở.

Cách bắt đầu sử dụng

Tìm hiểu cách thức hoạt động của Amazon EMR

Tìm hiểu thêm về việc cung cấp các cụm, thay đổi quy mô tài nguyên, cấu hình độ sẵn sàng cao, v.v.

Khám phá các tính năng của Amazon EMR »

Khám phá mức định giá Amazon EMR


Thanh toán theo mức sử dụng theo giây với các lựa chọn chạy cụm EMR trên Amazon Elastic Compute Cloud (EC2), Amazon EKS hoặc AWS Outposts.

Tìm hiểu thêm về mức định giá Amazon EMR »

Bắt đầu sử dụng Amazon EMR


Tìm hiểu về việc xử lý phát trực tiếp theo thời gian thực, công nghệ máy học ở quy mô lớn, v.v. bằng cách sử dụng EMR.

Xem các hướng dẫn về Amazon EMR »

Khám phá thêm về AWS