9 дополнительных преобразований визуального интерфейса ETL в Amazon SageMaker

Проведено: 2 апр. 2025 г.

Визуальный интерфейс извлечения, преобразования и загрузки (ETL) в Amazon SageMaker предлагает девять новых встроенных преобразований: Derived column (Производный столбец), Flatten (Сглаживание), Add current timestamp (Добавление текущей метки времени), Explode array or map into rows (Разделение массива или сопоставления на строки), To timestamp (Преобразование в метку времени), Array to columns (Преобразование массива в столбцы), Intersect (Пересечение), Limit (Ограничение) и Concatenate columns (Объединение столбцов).

Визуальный интерфейс ETL в Amazon SageMaker позволяет создавать процедуры ETL с использованием перетаскивания и при поддержке Amazon Q для разработчиков. Новые преобразования позволяют разработчикам ETL быстро создавать более сложные конвейеры данных без необходимости писать собственный код для стандартных задач преобразования. Каждое из этих новых преобразований отвечает уникальным потребностям в обработке данных. Например, преобразование Derived column (Производный столбец) позволяет задать новый столбец на основе математической формулы или SQL-выражения, To timestamp (Преобразование в метку времени) – привести столбец к типу временной метки, а Concatenate columns (Объединение столбцов) – создать новый столбец строк на основе значений из других столбцов с опциональным разделителем.

Эта новая функция теперь доступна во всех регионах AWS, где предлагается Amazon SageMaker. Самую актуальную информацию о доступности см. в списке поддерживаемых регионов.

Чтобы узнать больше, ознакомьтесь с документацией Amazon SageMaker.