Возможности AWS Clean Rooms

Создайте clean rooms за считаные минуты. Сотрудничайте со своими партнерами, не передавая необработанные данные.

Что такое AWS Clean Rooms?

AWS Clean Rooms упрощает вам и вашим партнерам анализ и сотрудничество при работе с общими наборами данных для получения ценных выводов. При этом не нужно раскрывать другим участникам свои базовые данные. C помощью AWS Clean Rooms вы можете создавать собственные пустые комнаты за считанные минуты и приступать к анализу общих наборов данных, выполнив лишь несколько шагов. При использовании AWS Clean Rooms можно приглашать любое количество клиентов AWS для сотрудничества, выбирать наборы данных, а затем настраивать ограничения для участников. Вы можете сотрудничать с сотнями тысяч компаний, уже использующих AWS. При этом не нужно хранить копии данных за пределами среды AWS или загружать их на другую платформу.

Shot of a young businesswoman working on a computer in an office. Portrait of an successful young creative businesswoman using PC at her workplace in the modern office

Создайте собственную пустую комнату, добавьте участников и начните совместную работу без лишних усилий

AWS Clean Rooms позволяет вам быстрее и проще развертывать собственные пустые комнаты без необходимости создавать, управлять и обслуживать свои решения. Компании также могут воспользоваться API для интеграции функций AWS Clean Rooms в свои рабочие процессы.

Сотрудничайте с сотнями тысяч компаний на платформе AWS без необходимости раскрывать базовые данные

AWS Clean Rooms позволяет быстро и легко генерировать аналитическую информацию на основе данных, полученных из нескольких источников, с минимальным объемом их перемещения и без необходимости копировать или раскрывать базовые данные. Вы можете напрямую разрешить доступ к своим данным в Простом сервисе хранения данных Amazon (Amazon S3) и быстро приступить к сотрудничеству со своими партнерами или любыми из сотен тысяч клиентов AWS, создающих озера данных на Amazon S3.

hand together creative agency business brain storm meeting presentation Team discussing roadmap to product launch, presentation, planning, strategy, new business development
Cybersecurity and privacy concepts to protect data. Lock icon and internet network security technology. Businessmen protecting personal data on laptop and virtual interfaces.

Защитите базовые данные с помощью широкого набора средств управления пустыми комнатами, повышающих уровень конфиденциальности

AWS Clean Rooms поддерживает строгие политики обработки данных благодаря широкому набору возможностей повышения уровня конфиденциальности, включая детальные правила анализа, платформу дифференциальной конфиденциальности AWS Clean Rooms и вычисления с использованием криптографической защиты. Кроме того, вы можете воспользоваться журналами запросов, чтобы понять, как запрашиваются ваши данные, и удостовериться в правильности запросов.

Используйте гибкие правила анализа SQL и машинное обучение, повышающее уровень конфиденциальности, в соответствии с потребностями своего бизнеса

Генерируйте аналитические данные с помощью SQL-анализа или моделирования в AWS Clean Rooms ML. В SQL можно использовать агрегацию, списки и настраиваемые запросы. Вы также можете применять Analysis Builder, чтобы получать аналитические данные без необходимости писать SQL-код. AWS Clean Rooms ML поможет вам применить машинное обучение для получения аналитических данных, не делясь при этом необработанными данными с другими.

Programer sitting on desk discussing with mixed team of software developers about artificial intelligence

Многосторонность

С помощью AWS Clean Rooms можно анализировать данные с многочисленными сторонами. Каждый участник сотрудничества хранит данные в своих учетных записях. Вы можете безопасно получать аналитическую информацию на основе своих коллективных данных и коллективных данных партнеров без необходимости писать код. Вы можете создать пустую комнату, пригласить компании, с которыми хотите сотрудничать, и выбрать, какие участники могут выполнять анализы SQL или генерировать прогнозирующие выводы в AWS Clean Rooms ML в рамках совместной работы.

Нет необходимости хранить копию данных

С помощью AWS Clean Rooms можно легко сотрудничать с сотнями тысяч компаний, уже использующих AWS. При этом не нужно хранить копии данных за пределами среды AWS или загружать их на другую платформу. После создания среды для совместной работы или присоединения к ней можно настроить одну или больше таблиц данных из Каталога данных AWS Glue. Запуская запросы, обучая модель машинного обучения или генерируя прогнозирующую аналитику, AWS Clean Rooms считывает данные там, где они находятся. При использовании анализа SQL-запросов можно указать правила и ограничения SQL-запросов, допустимые для данных, которые автоматически применяются для защиты базовых данных каждого участника. Кроме того, можно настроить ограничения выходных данных, например минимальные пороги для объединений. При использовании AWS Clean Rooms ML базовые данные, используемые для обучения модели или генерирования аналогичного сегмента, никогда не передаются сотрудникам и не используются AWS для обучения моделей.

Полный программный доступ

Помимо Консоли управления AWS, все функциональные возможности AWS Clean Rooms доступны через API. Вы сможете использовать пакеты средств разработки (SDK) AWS или интерфейс командной строки, чтобы автоматизировать операции AWS Clean Rooms, интегрировать функциональные возможности Clean Rooms в имеющиеся рабочие процессы и продукты либо создать собственную версию предложения Clean Rooms для своих клиентов.

Гибкий SQL

Правила анализа – эти ограничения предоставляют вам встроенные способы контроля использования данных. Участники совместной работы, создающие или присоединяющиеся к ней в качестве назначенных исполнителей запросов, могут писать запросы для пересечения и анализа таблиц данных в соответствии с установленными правилами анализа. AWS Clean Rooms поддерживает три типа правил анализа: объединение, список и настройка.

Правило анализа «объединение»: правило анализа «объединение» позволяет выполнять запросы, генерирующие объединенную статистику, например размер пересечения двух наборов данных. Используя правило анализа «объединение», можно обеспечить выполнение только объединенных запросов к данным и наложить ограничения на определенные части выполняемых запросов, например на то, какие столбцы должны использоваться только в слепом совпадении и какие столбцы могут быть использованы в объединениях, таких как суммы, подсчеты или средние значения. Вы также управляете минимальным ограничением объединения в выходных данных.  Кроме того, можно установить минимальные ограничения для объединений, которые дают возможность устанавливать условия для возвратов строк выходных данных. Эти ограничения устанавливаются в форме COUNT DISTINCT (Столбец) ≥ Порог. Если строка выходных данных в результатах запроса не соответствует ни одному из ограничений, она удаляется из набора результатов. Это помогает обеспечить автоматическое применение минимальных пороговых значений для объединения, а также обеспечивает гибкость для участников совместной работы с данными, которые могут писать запросы по своему усмотрению.

Правило анализа «списки»: правило анализа «списки» позволяет выполнять запросы, извлекающие список пересечения нескольких наборов данных на уровне строк, например перекрытия двух наборов данных. Используя правило анализа «списки», можно обеспечить выполнение только запросов списков к данным и наложить ограничения на выполняемые запросы, например на то, какие столбцы должны использоваться только в слепом совпадении, а какие можно выводить в виде списка в выходных данных.

Правило «настраиваемый анализ»: правило «настраиваемый анализ» позволяет создавать собственные запросы, используя большинство стандартных SQL-запросов ANSI, таких как общие табличные выражения (CTE) и оконные функции. Кроме того, можно просматривать и разрешать запросы до того, как участники совместной работы их запустят, и проверять запросы других участников, прежде чем им будет разрешено выполнять их в ваших таблицах. При использовании правила анализа «настройка» вы можете использовать встроенные средства управления, чтобы заранее определить или ограничить способы анализа базовых данных вместо того, чтобы полагаться на журналы запросов после завершения анализа. При использовании настраиваемых SQL-запросов вы также можете создавать или использовать шаблоны анализа для хранения настраиваемых запросов с параметрами при совместной работе. Это позволяет клиентам легче помогать друг другу в совместной работе. Например, участник, обладающий большим опытом работы с SQL, может создавать шаблоны, которые другие участники могут просматривать и, возможно, запускать. Это также упрощает повторный анализ в ходе совместной работы. Можно также использовать дифференциальную конфиденциальность AWS Clean Rooms, выбрав собственное правило анализа, а затем настроив параметры дифференциальной конфиденциальности.

Дифференциальная конфиденциальность

Дифференциальная конфиденциальность AWS Clean Rooms (ознакомительная версия) помогает защитить конфиденциальность пользователей с помощью интуитивно понятного и математического управления за несколько шагов. Дифференциальная конфиденциальность – это строгое математическое определение защиты конфиденциальности данных, однако настройка этого метода сложна и требует глубокого понимания теории и математических формул для ее эффективного применения. Дифференциальная конфиденциальность AWS Clean Rooms – это интуитивно понятная и полностью управляемая функция AWS Clean Rooms, которая помогает предотвратить повторную идентификацию пользователей. Чтобы использовать эту функцию, не обязательно иметь опыт работы с дифференциальной конфиденциальностью. Дифференциальная конфиденциальность AWS Clean Rooms скрывает вклад данных любого человека в объединенные выходные данные совместной работы Clean Rooms и позволяет выполнять широкий спектр SQL-запросов для получения информации о рекламных кампаниях, инвестиционных решениях, клинических исследованиях и многом другом. Вы можете настроить дифференциальную конфиденциальность AWS Clean Rooms, применив собственное правило анализа при совместной работе с AWS Clean Rooms. Затем вы можете настроить дифференциальную конфиденциальность AWS Clean Rooms с помощью элементов управления, гибко подстраиваемых под конкретные бизнес-сценарии использования и применяемых всего за несколько шагов. Дифференциальная конфиденциальность AWS Clean Rooms упрощает реализацию дифференциальной конфиденциальности при совместной работе с AWS Clean Rooms с помощью нескольких простых вариантов, и все это без дополнительных знаний или настроек со стороны партнеров.

Настраиваемые роли

Настраивая совместную работу в AWS Clean Rooms, можно указать разные возможности для каждого участника совместной работы в соответствии с конкретными сценариями использования SQL-запросов. Например, если вы хотите, чтобы выходные данные запроса перешли к другому участнику, вы можете назначить одного участника исполнителем SQL-запросов, который может писать запросы, а другого участника – получателем результатов SQL-запроса, который может получать результаты. Это дает автору совместной работы возможность убедиться в том, что участник, который может отправить запрос, не имеет доступа к результатам запроса. Настраивая совместную работу, вы также можете настроить обязанности по оплате SQL-запросов и назначить выбранного участника, которому будет выставляться счет за расходы на вычисления запросов при совместной работе вместо того, чтобы выставлять счета автоматически исполнителю запроса. Это позволяет более гибко работать вместе с партнерами и распределять обязанности SQL вместо того, чтобы привязывать их к исполнителю запросов.

Без конструктора анализа кода

С помощью Analysis Builder бизнес-пользователи могут получать аналитические сведения за несколько простых шагов без необходимости писать или понимать SQL. В управляемом пользовательском интерфейсе вы можете создавать запросы, соответствующие ограничениям данных, установленным каждым сотрудником в своих таблицах, на основе автоматически предложенных критериев, таких как метрики, сегменты и фильтры, относящиеся к вашим коллективным наборам данных. Используйте Analysis Builder в совместной работе, в которой есть одна или две таблицы, настроенные на правило объединения или анализа списков.

Машинное обучение, повышающее конфиденциальность

Сервис машинного обучения AWS Clean Rooms ML помогает вам и вашим партнерам применять машинное обучение в соответствии с правилами защиты конфиденциальности, чтобы выполнять прогнозную аналитику без необходимости обмена необработанными данными. Первая модель этой возможности предназначена для оказания помощи компаниям в создании аналогичных сегментов. При использовании моделирования по сходным признакам в рамках AWS Clean Rooms ML можно обучить собственную модель на основе ваших данных и предложить партнерам предоставить в ходе совместной работы небольшой образец записей, чтобы создать расширенный набор аналогичных записей и защитить себя и базовые данные вашего партнера. Моделирование в сфере здравоохранения будет доступно в ближайшие месяцы.

Благодаря AWS Clean Rooms ML вы сохраняете полный контроль и право собственности на свои обученные модели, в том числе на то, когда использовать их для создания аналогичных сегментов совместно с партнерами или удалять их. Ваши данные будут применяться только для обучения вашей модели, а не модели AWS. Вы можете использовать интуитивно понятные элементы управления, которые помогут вам и вашим партнерам настроить прогнозные результаты модели. Например, авиакомпания может оперировать данными о своих клиентах, сотрудничать со службой онлайн-бронирования и выявлять потенциальных путешественников со схожими характеристиками, при этом ни одна из компаний не будет передавать друг другу свои базовые данные. AWS Clean Rooms ML устраняет необходимость делиться данными для создания, обучения и развертывания моделей машинного обучения с партнерами.

Сервис AWS Clean Rooms ML был создан и протестирован на широком спектре наборов данных, таких как электронная коммерция и потоковое видео, и может помочь вам повысить точность моделирования двойников до 36 % по сравнению с репрезентативными отраслевыми базовыми показателями. В реальных приложениях, таких как поиск новых клиентов, такое повышение точности может привести к экономии миллионов долларов.

Криптографические вычисления

Можно выполнять запросы AWS Clean Rooms для данных, имеющих криптографическую защиту. Если у вас есть политики обработки данных, требующие шифрования конфиденциальных данных, вы можете предварительно зашифровать свои данные с помощью общего ключа, предназначенного для конкретной совместной работы, чтобы данные оставались зашифрованными даже при выполнении запросов. Криптографические вычисления сохраняют шифрование данных, используемых для совместных вычислений: в месте хранения, при передаче и при использовании (обработке).

Криптографические вычисления для Clean Rooms (C3R) – это Java SDK с открытым исходным кодом и интерфейс командной строки, который доступен на GitHub. Эта функция доступна без дополнительной оплаты. Если у вас есть большие данные, вы можете ознакомиться с документацией, чтобы узнать, как можно интегрировать C3R в Apache Spark.

Эта функция является последней из широкого спектра инструментов для криптографических вычислений AWS, разработанной для того, чтобы помочь вам достичь целей безопасности и соответствия нормативным требованиям, позволяя при этом воспользоваться гибкостью, масштабируемостью, производительностью и простотой использования, которые предлагает AWS.