AWS Clean Rooms поддерживает генерацию синтетических наборов данных для пользовательских моделей машинного обучения

Проведено: 30 нояб. 2025 г.

Теперь AWS Clean Rooms позволяет вам и вашим партнерам на основе коллективных данных генерировать синтетические наборы данных, повышающие конфиденциальность, для задач регрессии и классификации для моделей машинного обучения (ML).

Генерация синтетических наборов данных позволяет создавать наборы обучающих данных со статистическими свойствами, аналогичными исходным данным, без доступа обучающего кода к реальным записям. Новая возможность позволяет обезличивать субъекты (например, людей или организации, о которых были собраны сведения) в исходных данных. Это устраняет риск, что модель запомнит информацию о конкретных лицах из обучающих данных. Благодаря этому доступно обучение моделей ML для новых примеров использования, которые ранее ограничивались по соображениям конфиденциальности, – например, оптимизация кампаний, выявление мошенничества и медицинские исследования. Например, авиакомпания, использующая собственный алгоритм, хочет совместно с гостиничным брендом проводить рекламные акции для высокодоходных клиентов. При этом ни одна из организаций не хочет предоставлять конфиденциальные данные о потребителях. Используя AWS Clean Rooms ML, они могут создать синтетическую версию своего коллективного набора данных и обучать модель без раскрытия необработанных данных. Это позволит повысить точность рекламного таргетинга и при этом защитить конфиденциальность клиентов.

Дополнительные сведения о регионах AWS, в которых доступно решение AWS Clean Rooms ML, приведены в таблице регионов AWS. См. дополнительные сведения об AWS Clean Rooms ML.