- Amazon SageMaker›
- Xử lý dữ liệu Amazon SageMaker›
- Câu hỏi thường gặp
Câu hỏi thường gặp về xử lý dữ liệu Amazon SageMaker
Chủ đề trang
Thông tin chung
Mở tất cảTính năng Xử lý dữ liệu SageMaker phân tích, chuẩn bị, tích hợp và sắp xếp dữ liệu của bạn nhờ các khả năng xử lý từ Amazon Athena, Amazon EMR, AWS Glue và Quy trình làm việc được quản lý của Amazon dành cho Apache Airflow (Amazon MWAA). Bạn có thể sử dụng các khung xử lý dữ liệu nguồn mở như Apache Spark, phân tích dữ liệu trên quy mô lớn với Trino và xây dựng phân tích theo thời gian thực một cách liền mạch với Apache Flink và Apache Spark.
Xử lý dữ liệu SageMaker kết hợp Amazon EMR, Athena, AWS Glue và Amazon MWAA.
Tính năng Xử lý dữ liệu SageMaker giúp bạn khám phá dữ liệu, xây dựng các tác vụ chuyển đổi dữ liệu, sắp xếp và triển khai các quy trình dữ liệu trên quy mô lớn. Tính năng này giúp cải thiện hiệu năng, thúc đẩy quá trình thu được thông tin chuyên sâu nhanh hơn so với các hệ thống nguồn mở truyền thống với các phiên bản tương thích API nguồn mở và tiết kiệm chi phí của Apache Spark, Apache Airflow, Apache Flink, Trino, v.v. Xử lý dữ liệu SageMaker cung cấp quyền truy cập vào các nguồn dữ liệu của bạn trong Hồ dữ liệu Amazon SageMaker thông qua tích hợp không ETL, khả năng truy vấn liên kết và các bộ kết nối.
Di chuyển và truy cập
Mở tất cảKhông, bạn không cần phải di chuyển sang SageMaker. Bạn có thể tiếp tục sử dụng Amazon EMR, Athena, AWS Glue và Amazon MWAA như hiện tại. Tuy nhiên, chúng tôi khuyên bạn nên bắt đầu với SageMaker để tận dụng các công cụ thống nhất, quản trị dữ liệu tích hợp sẵn và các kiến trúc Hồ dữ liệu SageMaker được đơn giản hóa.
Mã, truy vấn, tác vụ hiện tại và các tài nguyên khác mà bạn đã tạo và sử dụng với Amazon EMR, Athena hoặc AWS Glue sẽ không bị ảnh hưởng. Bạn có thể tiếp tục sử dụng các dịch vụ này cho khối lượng công việc mới, nếu muốn. Các tài nguyên được tạo trong các dịch vụ này, chẳng hạn như Amazon EMR trên các cụm Amazon Elastic Compute Cloud (Amazon EC2), có thể hiển thị trong SageMaker để đơn giản hóa việc phát triển các ứng dụng phân tích và AI. Các trải nghiệm phát triển hiện có được tích hợp trong Amazon EMR, AWS Glue và Athena sẽ tiếp tục tồn tại cùng với một trải nghiệm phát triển mới trong SageMaker.
Phiên bản mới nhất của AWS Glue, AWS Glue 5.0, có sẵn trong SageMaker. AWS Glue 5.0 tăng tốc khối lượng công việc xử lý dữ liệu và cung cấp thời gian hoạt động Apache Spark 3.5.2 được tối ưu hóa hiệu năng mới nhất để bạn có thể phát triển, chạy và điều chỉnh quy mô để có thông tin chuyên sâu nhanh hơn. Để tìm hiểu thêm, hãy truy cập AWS Glue.
Giá cả
Mở tất cảMỗi dịch vụ AWS mà bạn sử dụng thông qua SageMaker phải chịu mức giá riêng. Để biết thêm chi tiết, vui lòng tham khảo trang giá AWS cho Athena, Amazon EMR, AWS Glue và Amazon MWAA.