AWS Glue
Khám phá, chuẩn bị và tích hợp tất cả dữ liệu của bạn ở mọi quy mô
1 triệu đối tượng được lưu trữ miễn phí
Cách thức hoạt động
AWS Glue là một dịch vụ tích hợp dữ liệu phi máy chủ, giúp người dùng dễ dàng khám phá, chuẩn bị, di chuyển và tích hợp dữ liệu từ nhiều nguồn cho hoạt động phân tích, máy học (ML) và phát triển ứng dụng.
-
Các tùy chọn về công cụ tích hợp dữ liệu
-
ETL định hướng theo sự kiện
-
Danh mục dữ liệu AWS Glue
-
Tác vụ ETL không cần mã
-
Quản lý và giám sát chất lượng dữ liệu
-
Chuẩn bị dữ liệu
-
Các tùy chọn về công cụ tích hợp dữ liệu
-
Chọn công cụ tích hợp dữ liệu bạn muốn trong AWS Glue để hỗ trợ người dùng và khối lượng công việc.
-
ETL định hướng theo sự kiện
-
AWS Glue có thể chạy các tác vụ trích xuất, chuyển đổi và tải (ETL) của bạn khi có dữ liệu mới. Ví dụ: bạn có thể cấu hình AWS Glue để khởi chạy các tác vụ ETL ngay khi dữ liệu mới xuất hiện trong Dịch vụ lưu trữ đơn giản (S3) của Amazon.
-
Danh mục dữ liệu AWS Glue
-
Bạn có thể sử dụng Danh mục dữ liệu để khám phá nhanh và tìm kiếm nhiều tập dữ liệu AWS mà không phải di chuyển dữ liệu. Một khi đã được lập danh mục, dữ liệu sẽ ngay lập tức có sẵn để tìm kiếm và truy vấn bằng Amazon Athena, Amazon EMR và Amazon Redshift Spectrum.
-
Tác vụ ETL không cần mã
-
AWS Glue Studio giúp bạn dễ dàng tạo, chạy và theo dõi các tác vụ ETL của AWS Glue một cách trực quan. Bạn có thể dùng trình biên tập dạng kéo và thả để xây dựng các tác vụ ETL nhằm di chuyển cũng như chuyển đổi dữ liệu và AWS Glue sẽ tự động tạo mã cho bạn.
-
Quản lý và giám sát chất lượng dữ liệu
-
Chất lượng dữ liệu AWS Glue tự động hóa việc thiết lập quy tắc, quản lý và giám sát chất lượng dữ liệu để giúp đảm bảo dữ liệu có chất lượng cao trên các hồ dữ liệu và quy trình của bạn.
-
Chuẩn bị dữ liệu
-
Với AWS Glue DataBrew, bạn có thể khám phá và thí nghiệm dữ liệu ngay từ chính hồ dữ liệu, kho dữ liệu và cơ sở dữ liệu của mình, bao gồm Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora và Dịch vụ cơ sở dữ liệu quan hệ (RDS) của Amazon. Bạn có thể lựa chọn từ hơn 250 phép chuyển đổi xây dựng sẵn trong DataBrew để tự động hóa các tác vụ chuẩn bị dữ liệu, chẳng hạn như lọc điểm bất thường, tiêu chuẩn hóa định dạng và sửa đổi các giá trị không hợp lệ.
Trường hợp sử dụng
Đơn giản hóa việc phát triển quy trình ETL
Loại bỏ khâu quản lý cơ sở hạ tầng bằng khả năng cung cấp tự động và quản lý nhân lực, đồng thời hợp nhất toàn bộ nhu cầu tích hợp dữ liệu của bạn vào một dịch vụ duy nhất.
Khám phá dữ liệu hiệu quả
Nhanh chóng xác định dữ liệu trên nhiều tập dữ liệu AWS, sau đó đưa dữ liệu này về trạng thái sẵn sàng để truy vấn và chuyển đổi ngay lập tức.
Tương tác khám phá, thử nghiệm và xử lý dữ liệu
Với phiên tương tác AWS Glue, kỹ sư dữ liệu có thể tương tác khám phá và chuẩn bị dữ liệu bằng môi trường phát triển tích hợp (IDE) hoặc sổ tay tùy chọn.
Hỗ trợ nhiều khung xử lý và khối lượng công việc
Hỗ trợ nhiều khung xử lý dữ liệu khác nhau, chẳng hạn như ETL và ELT, cũng như nhiều khối lượng công việc khác nhau dễ dàng hơn, bao gồm khối lượng công việc theo lô, lô nhỏ và truyền phát.
Khách hàng
Cách bắt đầu
Dùng thử miễn phí AWS Glue
Khám phá, chuẩn bị, di chuyển và tích hợp dữ liệu từ nhiều nguồn nhờ sự dễ dàng của môi trường phi máy chủ.
Xây dựng với AWS Glue
Tìm hiểu cách tạo quy trình dữ liệu với giao diện ETL trực quan của AWS Glue Studio.
Tích hợp dữ liệu của bạn
Làm theo để thiết lập và bắt đầu sử dụng AWS Glue.