Amazon EMR

Dễ dàng chạy và thay đổi quy mô Apache Spark, Hive, Presto, và các khối lượng công việc dữ liệu lớn khác

Chạy các ứng dụng dữ liệu lớn và phân tích dữ liệu ở quy mô petabyte nhanh hơn, với chi phí thấp hơn một nửa so với các giải pháp tại chỗ.

Xây dựng ứng dụng bằng cách sử dụng các khung nguồn mở, với lựa chọn chạy trên các cụm Amazon EC2 tùy chỉnh, Amazon EKS, AWS Outposts hoặc Amazon EMR Serverless.

Thời gian có thông tin chuyên sâu nhanh hơn đến 2 lần với các phiên bản Spark, Hive và Presto có nguồn mở tương thích với API và được tối ưu hóa về hiệu suất.

Dễ dàng phát triển, hiển thị trực quan và gỡ lỗi cho ứng dụng của bạn bằng cách sử dụng EMR Notebooks và các công cụ nguồn mở quen thuộc trong EMR Studio.

Cách thức hoạt động

Amazon EMR là một nền tảng đám mây dữ liệu lớn có khả năng thực hiện công việc xử lý dữ liệu phân phối ở quy mô lớn, truy vấn SQL tương tác và chạy ứng dụng máy học (ML) sử dụng các khung phân tích nguồn mở như Apache Spark, Apache Hive, và Presto.

Cách thức hoạt động của Amazon EMR
 Nhấp vào để phóng to
Giới thiệu về EMR Serverless (2:02)
Giới thiệu về Amazon EMR Serverless
Amazon EMR Serverless là một lựa chọn mới trong Amazon EMR, giúp các kỹ sư và nhà phân tích dữ liệu có thể chạy các ứng dụng được xây dựng bằng các khung dữ liệu lớn có nguồn mở một cách dễ dàng và tiết kiệm chi phí, ví dụ như Apache Spark, Hive hoặc Presto, mà không phải điều chỉnh, vận hành, tối ưu hóa, bảo mật hay quản lý các cụm.
Giới thiệu về Amazon EMR Serverless
Amazon EMR Serverless là một lựa chọn mới trong Amazon EMR, giúp các kỹ sư và nhà phân tích dữ liệu có thể chạy các ứng dụng được xây dựng bằng các khung dữ liệu lớn có nguồn mở một cách dễ dàng và tiết kiệm chi phí, ví dụ như Apache Spark, Hive hoặc Presto, mà không phải điều chỉnh, vận hành, tối ưu hóa, bảo mật hay quản lý các cụm. EMR Serverless tăng giảm quy mô điện toán và tài nguyên bộ nhớ khi cần bằng ứng dụng của bạn và bạn chỉ phải trả tiền cho tài nguyên mà ứng dụng của bạn sử dụng.

Trường hợp sử dụng

Thực hiện phân tích dữ liệu lớn

Xử lý dữ liệu quy mô lớn và phân tích tình huống giả định bằng cách sử dụng thuật toán thống kê và mô hình dự đoán để khám phá những khuôn mẫu ẩn, tính tương quan, xu hướng thị trường và sở thích của khách hàng.

Xây dựng đường ống dữ liệu có thể thay đổi quy mô

Trích xuất dữ liệu từ nhiều nguồn khác nhau, xử lý theo quy mô và cung cấp dữ liệu cho ứng dụng và người dùng.

Xử lý các luồng dữ liệu theo thời gian thực

Phân tích sự kiện từ các nguồn dữ liệu truyền phát theo thời gian thực để tạo ra đường ống dữ liệu truyền phát lâu bền, có độ sẵn sàng cao cùng khả năng chịu lỗi.

Tăng tốc áp dụng khoa học dữ liệu và ứng dụng ML

Phân tích dữ liệu bằng cách sử dụng các khung ML mã nguồn mở, chẳng hạn như Apache Spark MLlib, TensorFlow và Apache MXNet. Kết nối với Amazon SageMaker Studio để đào tạo, phân tích và báo cáo mô hình quy mô lớn.

Cách bắt đầu sử dụng

Tìm hiểu cách thức hoạt động của Amazon EMR

Tìm hiểu thêm về việc cung cấp các cụm, thay đổi quy mô tài nguyên, cấu hình độ sẵn sàng cao, v.v.

Khám phá các tính năng của Amazon EMR »

Khám phá mức định giá của Amazon EMR

Trả tiền theo giây với các lựa chọn chạy cụm EMR trên Amazon EC2, Amazon EKS, AWS Outposts hoặc Amazon EMR Serverless.

Tìm hiểu thêm về định giá Amazon EMR »

Bắt đầu sử dụng Amazon EMR

Tìm hiểu về việc xử lý phát trực tiếp theo thời gian thực, công nghệ máy học ở quy mô lớn, v.v. bằng cách sử dụng EMR.

Xem các hướng dẫn về Amazon EMR »

Khám phá thêm về AWS