Amazon Redshift внедряет новые функции обработки массивов полуструктурированных данных
Amazon Redshift теперь поддерживает девять новых функций для работы с массивами полуструктурированных данных типа SUPER. Новые функции ARRAY_CONTAINS, ARRAY_DISTINCT, ARRAY_EXCEPT, ARRAY_INTERSECTION, ARRAY_POSITION, ARRAY_POSITIONS, ARRAY_SORT, ARRAY_UNION и ARRAYS_OVERLAP позволяют искать, сравнивать, сортировать и преобразовывать массивы напрямую в SQL-запросах. В прошлом для выполнения этих операций необходимо было писать собственную сложную SQL-логику PartiQL.
Новые функции упрощают сложное преобразование данных и уменьшают сложность запросов, позволяя выполнять изощренные операции с массивами в одном SQL-выражении. К примеру, можно использовать ARRAY_CONTAINS и ARRAY_POSITION для поиска элементов, ARRAY_INTERSECTION и ARRAY_EXCEPT для операций с наборами или ARRAY_SORT и ARRAY_DISTINCT для упорядочения и дедупликации данных. Эти функции особенно полезны для задач с многоуровневыми структурами данных, обработки событий и для рабочих процессов аналитики, в которых необходима агрегация, фильтрация или преобразование данных в большом масштабе.
Новые функции массивов Amazon Redshift доступны во всех регионах AWS, включая регионы AWS GovCloud (США), где доступен этот сервис. Дополнительные сведения см. в нашей документации.