Amazon EMR

Dễ dàng chạy và điều chỉnh quy mô Apache Spark, Hive, Presto và các khối lượng công việc dữ liệu lớn khác

Giới thiệu về EMR phi máy chủ

Amazon EMR Serverless là một lựa chọn mới trong Amazon EMR, giúp các kỹ sư và nhà phân tích dữ liệu có thể chạy các ứng dụng được xây dựng bằng các khung dữ liệu lớn có nguồn mở một cách dễ dàng và tiết kiệm chi phí, ví dụ như Apache Spark, Hive hoặc Presto, mà không phải điều chỉnh, vận hành, tối ưu hóa, bảo mật hay quản lý các cụm.

Lợi ích

Chạy các ứng dụng dữ liệu lớn và phân tích dữ liệu ở quy mô petabyte nhanh hơn, với chi phí thấp hơn một nửa so với các giải pháp tại chỗ.

Xây dựng ứng dụng bằng cách sử dụng các khung nguồn mở mới nhất, với tùy chọn chạy trên các cụm Amazon EC2 tùy chỉnh, Amazon EKS, AWS Outposts, hoặc Amazon EMR phi máy chủ.

Thời gian có thông tin chuyên sâu nhanh hơn đến 2 lần với các phiên bản Spark, Hive và Presto có nguồn mở tương thích với API và được tối ưu hóa về hiệu suất.

Dễ dàng phát triển, hiển thị trực quan và gỡ lỗi cho ứng dụng của bạn bằng cách sử dụng Sổ tay EMR và các công cụ nguồn mở quen thuộc trong Studio EMR.

Trường hợp sử dụng

Xử lý dữ liệu quy mô lớn và phân tích tình huống giả định bằng cách sử dụng thuật toán thống kê và mô hình dự đoán để khám phá những khuôn mẫu ẩn, tính tương quan, xu hướng thị trường và sở thích của khách hàng.
Trích xuất dữ liệu từ nhiều nguồn khác nhau, xử lý theo quy mô và cung cấp dữ liệu cho ứng dụng và người dùng.
Phân tích sự kiện từ các nguồn dữ liệu truyền phát theo thời gian thực để tạo ra đường ống dữ liệu truyền phát lâu bền, có độ sẵn sàng cao cùng khả năng chịu lỗi.
Phân tích dữ liệu bằng cách sử dụng các khung ML mã nguồn mở, chẳng hạn như Apache Spark MLlib, TensorFlow và Apache MXNet. Kết nối với Amazon SageMaker Studio để đào tạo, phân tích và báo cáo mô hình quy mô lớn.

Khám phá thêm về AWS