Поддержка создания и оценки правил качества данных в Единой студии Amazon SageMaker

Проведено: 20 мая 2026 г.

Единая студия Amazon SageMaker теперь поддерживает создание и оценку выполнения правил на основе Качества данных AWS Glue. Инженеры, аналитики и специалисты по обработке данных могут задавать правила обеспечения качества данных, запускать оценку выполнения для наборов правил и просматривать результаты непосредственно в Единой студии SageMaker как для данных в местах хранения (таблицах каталога), так и для данных в движении (в заданиях Визуального инструмента ETL). Это помогает выявлять проблемы с качеством данных до того, как плохие данные попадут в озера данных или повлияют на последующие рабочие нагрузки аналитики и машинного обучения.

Благодаря запуску этих возможностей вы сможете создавать правила на том же языке Data Quality Definition Language (DQDL), который применяется для Качества данных AWS Glue, и запускать оценку непосредственно в Единой студии SageMaker, используя два разных рабочих процесса. Для данных в местах хранения доступна специальная вкладка «Качество данных» для ресурсов каталога, которая позволяет создавать правила, оценивать их выполнение по требованию или по расписанию, а также получать подробные результаты выполнения или сбоя каждого правила. Для данных в движении вы можете добавлять к любому заданию Визуального инструмента ETL преобразование «Оценка качества данных» и просматривать результаты оценки в составе сведений о выполнении. Возможно создание наборов правил, чтобы проверять полноту, уникальность, свежесть, точность и другие параметры качества данных.

Эта функция поддерживается во всех регионах AWS, где доступна Единая студия Amazon SageMaker, как в доменах на базе Центра идентификации AWS IAM, так и в доменах на основе IAM. Дополнительные сведения см. в документации Единой студии Amazon SageMaker.