Amazon SageMaker Catalog bổ sung khả năng tìm kiếm định danh kỹ thuật chính xác trong SageMaker Unified Studio
Amazon SageMaker Catalog, tích hợp trong thế hệ tiếp theo của Amazon SageMaker, hiện hỗ trợ khả năng tìm kiếm nâng cao với chức năng khớp chính xác và khớp một phần cho các định danh kỹ thuật, như tên cột và bảng. Tính năng này cho phép người dùng thực hiện tìm kiếm chính xác bằng cách đính kèm các cụm từ trong dấu phân định, chẳng hạn như dấu ngoặc kép (“ ”), giúp họ nhanh chóng tìm nội dung có tên kỹ thuật chính xác hoặc một phần. Ví dụ: các nhà phân tích có thể tìm thấy các cột cụ thể nhanh hơn, người quản lý có thể xác thực nội dung bằng cách sử dụng các mẫu đặt tên như “audit_” và các kỹ sư có thể xác định các bảng tạm thời với tiền tố như “temp_”.
Dựa trên chức năng tìm kiếm bằng từ khóa và ngữ nghĩa mà SageMaker Catalog cung cấp, cải tiến này được thiết kế cho các tổ chức quản lý danh mục dữ liệu quy mô lớn với quy ước đặt tên phức tạp. Ví dụ: tìm kiếm “customer_id” chỉ trả về những nội dung có kết quả khớp chính xác, trong khi truy vấn dạng “sales_” trả về các nội dung như sales_summary và sales_data_2024. Những khả năng này giúp người dùng nhanh chóng tìm được nội dung kỹ thuật, cải thiện khả năng quản trị dữ liệu thông qua việc giảm lỗi và tăng cường cộng tác.
Xem tài liệu về sản phẩm để tìm hiểu thêm về cách thiết lập quy tắc siêu dữ liệu cho quy trình đăng ký và xuất bản.