- Amazon SageMaker›
- Xử lý dữ liệu Amazon SageMaker›
- Câu hỏi thường gặp
Câu hỏi thường gặp về xử lý dữ liệu Amazon SageMaker
Thông tin chung
Tính năng Xử lý dữ liệu Amazon SageMaker là gì?
Tính năng Xử lý dữ liệu Amazon SageMaker phân tích, chuẩn bị, tích hợp và sắp xếp dữ liệu của bạn nhờ các khả năng xử lý từ Amazon Athena, Amazon EMR, AWS Glue và Amazon Managed Workflows for Apache Airflow (MWAA). Bạn có thể tận dụng các khung xử lý dữ liệu nguồn mở như phân tích dữ liệu Apache Spark trên quy mô lớn với Trino và xây dựng phân tích liền mạch theo thời gian thực với Apache Flink và Apache Spark.
Những dịch vụ nào được cung cấp trong Xử lý dữ liệu Amazon SageMaker?
Xử lý dữ liệu Amazon SageMaker kết hợp Amazon EMR, Amazon Athena, AWS Glue và Amazon Managed Workflow cho Apache Airflow.
Tại sao tôi nên sử dụng tính năng Xử lý dữ liệu SageMaker?
Tính năng Xử lý dữ liệu SageMaker giúp bạn khám phá dữ liệu, xây dựng các công việc chuyển đổi dữ liệu, sắp xếp và triển khai các đường ống dữ liệu trên quy mô lớn. Tính năng này giúp cải thiện hiệu suất, thúc đẩy tìm hiểu thông tin chi tiết nhanh hơn các hệ thống nguồn mở truyền thống với các phiên bản tương thích API nguồn mở và tiết kiệm chi phí của Apache Spark, Apache Airflow, Apache Flink, Trino, v.v. Xử lý dữ liệu cung cấp quyền truy cập vào các nguồn dữ liệu của bạn trong Hồ dữ liệu Amazon SageMaker thông qua tích hợp không ETL, khả năng truy vấn liên kết và kết nối.
Di chuyển và Truy cập
Tôi có cần chuyển sang Amazon SageMaker để sử dụng các dịch vụ hiện có như Amazon EMR, Amazon Athena hoặc AWS Glue không?
Không, bạn không cần phải di chuyển sang Amazon SageMaker. Bạn có thể tiếp tục sử dụng Amazon EMR, Amazon Athena, AWS Glue và Amazon Managed Workflows cho Apache Airflow như hiện tại. Tuy nhiên, chúng tôi khuyên bạn nên bắt đầu với Amazon SageMaker để tận dụng các công cụ thống nhất, quản trị dữ liệu tích hợp và các kiến trúc Hồ dữ liệu Amazon SageMaker được đơn giản hóa.
Điều gì sẽ xảy ra với các công việc, truy vấn, mã và tài nguyên mà tôi đã tạo hoặc dự định tạo trong Amazon EMR, Amazon Athena hoặc AWS Glue?
Mã, truy vấn, công việc hiện tại và các tài nguyên khác mà bạn đã tạo và sử dụng với Amazon EMR, Amazon Athena hoặc AWS Glue sẽ không bị ảnh hưởng. Bạn có thể tiếp tục tận dụng các dịch vụ này cho khối lượng công việc mới, nếu muốn. Các tài nguyên được tạo trong các dịch vụ này, chẳng hạn như Amazon EMR trên các cụm EC2, có thể hiển thị trong Amazon SageMaker để đơn giản hóa việc phát triển các ứng dụng phân tích và AI. Các trải nghiệm phát triển hiện có được tích hợp trong Amazon EMR, AWS Glue và Amazon Athena sẽ tiếp tục tồn tại cũng với mộy trải nghiệm phát triển mới trong Amazon SageMaker.
Phiên bản Glue nào có sẵn trong Amazon SageMaker?
Phiên bản mới nhất của AWS Glue, Glue 5.0, có sẵn trong Amazon SageMaker. Glue 5.0 tăng tốc khối lượng công việc xử lý dữ liệu và cung cấp thời gian chạy Apache Spark 3.5.2 được tối ưu hóa hiệu suất mới nhất để bạn có thể phát triển, chạy và mở rộng để có thông tin chuyên sâu nhanh hơn. Để tìm hiểu thêm, hãy truy cập AWS Glue.
Định giá
Mô hình định giá cho tính năng Xử lý dữ liệu Amazon SageMaker là gì?
Mỗi Dịch vụ AWS mà bạn sử dụng thông qua Amazon SageMaker phải chịu mức giá riêng. Để biết thêm chi tiết, vui lòng tham khảo trang giá AWS cho Amazon Athena, Amazon EMR, AWS Glue và Amazon Managed Workflow Apache Airflow.