AWS Clean Rooms admite la generación de conjuntos de datos sintéticos para el entrenamiento personalizado de modelos de ML

Publicado en: 30 de nov de 2025

AWS Clean Rooms ahora les permite a usted y a sus socios generar conjuntos de datos sintéticos que mejoran la privacidad a partir de sus datos colectivos para entrenar modelos de machine learning (ML) de regresión y clasificación.

La generación de conjuntos de datos sintéticos les permite a usted y a sus socios crear conjuntos de datos de entrenamiento con propiedades estadísticas similares a las de los datos originales, sin que el código de entrenamiento tenga acceso a registros reales. Esta nueva capacidad anonimiza a los sujetos (como personas o entidades sobre las que se recopilaron datos) en los datos originales, lo que reduce el riesgo de que un modelo memorice información sobre las personas en los datos de entrenamiento. Esto desbloquea nuevos casos de uso de capacitación sobre modelos de ML que antes estaban restringidos por motivos de privacidad, como la optimización de campañas, la detección de fraudes y la investigación médica. Por ejemplo, una aerolínea con un algoritmo propio quiere colaborar con una marca hotelera para ofrecer promociones conjuntas a clientes de alto valor, pero ninguna de las dos organizaciones quiere compartir datos confidenciales de los consumidores. Con AWS Clean Rooms ML, pueden generar una versión sintética de su conjunto de datos colectivo para entrenar el modelo sin exponer datos sin procesar, lo que permite una segmentación de promociones más precisa y, al mismo tiempo, protege la privacidad de los clientes.

Para obtener más información sobre las regiones de AWS en las que está disponible AWS Clean Rooms ML, consulte la tabla de regiones de AWS. Para obtener más información, visite AWS Clean Rooms ML.