Расширенные конфигурации AWS Clean Rooms для оптимизации производительности SQL
Решение AWS Clean Rooms сегодня объявляет о поддержке расширенных конфигураций для повышения производительности SQL-запросов Spark. Запуск этой возможности позволит настраивать свойства Spark и размеры вычислительных ресурсов для SQL-запросов во время выполнения, что обеспечит дополнительную гибкость для соответствия нуждам производительности, масштабируемости и стоимости.
Решение AWS Clean Rooms позволяет настраивать свойства Spark, например разделы для перераспределения данных (shuffle) при параллельной обработке и пороговое значение autoBroadcastJoinThreshold для оптимизации операций объединения, чтобы лучше контролировать работу и параметры SQL-запросов при совместной работе в Clean Rooms. Кроме того, вы можете кэшировать данные существующей таблицы, содержащей результаты SQL-запроса, или создать и кэшировать новую таблицу, что поможет ускорить выполнение и снизить затраты для сложных запросов, использующих большие наборы данных. К примеру, рекламодатель, проводящий сравнение с контрольной группой в своих рекламных кампаниях, может указать произвольное количество работников для определенного типа инстанса и настроить свойства Spark, не редактируя SQL-запрос, чтобы оптимизировать траты.
С помощью AWS Clean Rooms можно за несколько минут создать безопасную пустую комнату и взаимодействовать с любой компанией в AWS или Snowflake, чтобы получать уникальную аналитику о рекламных кампаниях, инвестиционных решениях, исследованиях и разработках. Дополнительные сведения о регионах AWS, в которых доступен сервис AWS Clean Rooms, приведены в таблице регионов AWS. Чтобы узнать больше о взаимодействии с AWS Clean Rooms, посетите страницу AWS Clean Rooms.