Studio hợp nhất của Amazon SageMaker hiện hỗ trợ soạn thảo và đánh giá quy tắc chất lượng dữ liệu
Studio hợp nhất của Amazon SageMaker hiện hỗ trợ soạn thảo và đánh giá quy tắc chất lượng dữ liệu, được hỗ trợ bởi Chất lượng dữ liệu AWS Glue. Các kỹ sư dữ liệu, chuyên viên phân tích và nhà khoa học dữ liệu có thể xác định các quy tắc chất lượng dữ liệu, chạy đánh giá bộ quy tắc và xem kết quả trực tiếp trong Studio hợp nhất của SageMaker cho dữ liệu đang được lưu trữ trong bảng danh mục và dữ liệu đang được truyền trong các công việc ETL trực quan. Nhờ đó, bạn có thể phát hiện các vấn đề về chất lượng dữ liệu trước khi dữ liệu xấu đi vào hồ dữ liệu của bạn hoặc ảnh hưởng đến khối lượng công việc phân tích hạ nguồn và máy học.
Với lần ra mắt này, bạn có thể soạn thảo quy tắc bằng cùng Ngôn ngữ định nghĩa chất lượng dữ liệu (DQDL) được sử dụng trong Chất lượng Dữ liệu AWS Glue và chạy đánh giá trực tiếp trong Studio hợp nhất của SageMaker trên hai quy trình công việc. Đối với dữ liệu đang được lưu trữ, tab Chất lượng dữ liệu chuyên dụng trên tài nguyên danh mục cung cấp tính năng soạn thảo quy tắc, đánh giá theo nhu cầu hoặc theo lịch trình và kết quả đạt/không đạt theo từng quy tắc chi tiết. Đối với dữ liệu đang được truyền, bạn có thể thêm chuyển đổi Đánh giá chất lượng dữ liệu vào bất kỳ công việc ETL trực quan nào và xem lại kết quả chất lượng dữ liệu như một phần của chi tiết lượt chạy. Bạn có thể tạo bộ quy tắc kiểm tra tính đầy đủ, tính duy nhất, tính cập nhật, độ chính xác và các khía cạnh chất lượng dữ liệu khác.
Tính năng này được cung cấp ở tất cả các Khu vực AWS có Studio hợp nhất của Amazon SageMaker, trong cả miền dựa trên Trung tâm danh tính AWS IAM và dựa trên IAM. Để tìm hiểu thêm, hãy truy cập tài liệu về Studio hợp nhất của Amazon SageMaker.