Общедоступное многомерное размещение данных для Amazon Redshift

Проведено: 19 сент. 2025 г.

Amazon Redshift объявляет о появлении общедоступной возможности многомерного размещения данных (MDDL), которая динамически сортирует данные на основе текущих фильтров запросов, ускоряя выполнение запросов. В отличие от традиционных методов, в которых данные сортируются по фиксированным столбцам, MDDL сортирует данные на основе фильтров запросов (например, «продажи в США»), позволяя получить в 10 раз лучшую производительность на всех этапах для рабочих нагрузок запросов с повторяющимися фильтрами по сравнению с использованием только оптимальных ключей сортировки по одному столбцу.

Для каждой таблицы с ключом сортировки AUTO, который используется по умолчанию для таблиц без явно указанного ключа, Redshift анализирует историю запросов к ней и автоматически выбирает для таблицы либо ключ сортировки по одному столбцу, либо MDDL в зависимости от возможности повышения производительности для рабочей нагрузки. Сервис Redshift с MDDL автоматически создает виртуальный ключ многомерной сортировки, размещая друг рядом с другом строки, к которым обычно обращаются одни и те же запросы. Получившийся виртуальный столбец, эквивалентный новому ключу сортировки таблицы, затем используется при выполнении запросов, позволяя пропускать блоки данных и даже сканирование целых столбцов предикатов. Redshift с MDDL обеспечивает более выразительное обобщение составных и чередующихся ключей сортировки, значительно повышая скорость сканирования таблиц, особенно если рабочая нагрузка содержит повторяющиеся фильтры запросов. Для уже существующих таблиц с ключами сортировки, заданными вручную, вы можете использовать MDDL, изменив ключ сортировки таблицы на AUTO.

Метод MDDL доступен во всех коммерческих регионах AWS, где доступен сервис Redshift. Для начала прочтите документацию, блог и публикацию Amazon Science, чтобы узнать больше о том, как измеряется повышение производительности запросов.