- Análisis›
- AWS Clean Rooms›
- Características
Características de AWS Clean Rooms
Cree salas limpias en minutos. Colabore con sus socios sin compartir datos sin procesar
¿Por qué usar AWS Clean Rooms?
Cree su propia sala limpia, agregue participantes y comience a colaborar con pocos pasos
Colabore con cualquier empresa sin compartir ni revelar datos subyacentes
Proteja los datos subyacentes con un amplio conjunto de controles que mejoran la privacidad de las salas limpias
Vincule y compare los registros de los clientes, utilice herramientas de análisis flexibles y entrene e implemente modelos de ML con sus socios
Temas de la página
Múltiples partes
Abrir todoColabore en sus datos dondequiera que estén
Abrir todoAcceso completo mediante programación
Abrir todoFunciones configurables
Abrir todoAWS Entity Resolution en AWS Clean Rooms
Abrir todoPySpark
Abrir todoSQL flexible
Abrir todoLas reglas de análisis son restricciones que brindan un control integrado sobre cómo se pueden analizar los datos. Los miembros de la colaboración que crean una colaboración o se unen a ella como ejecutores de consultas designados pueden escribir consultas para intersecar y analizar las tablas de datos de acuerdo con las reglas de análisis que establezca. AWS Clean Rooms admite tres tipos de reglas de análisis: agregación, lista y personalizadas.
Regla de análisis de agregación: la regla de análisis de agregación permite ejecutar consultas que generan estadísticas agregadas, como el tamaño de la intersección de dos conjuntos de datos. Al usar la regla de análisis de agregación, puede hacer que solo se puedan ejecutar las consultas de agregación en los datos y aplicar restricciones en partes específicas de las consultas que se ejecutan, por ejemplo, qué columnas se deben usar solo en una coincidencia a ciegas y qué columnas se pueden usar en agregaciones, como sumas, recuentos o promedios. También puede controlar la restricción de agregación mínima en la salida. Además, puede establecer restricciones de agregación mínimas que le permitan establecer condiciones para los retornos de filas de salida. Estas restricciones se expresan en forma de COUNT DISTINCT (Column) >= Threshold. Si una fila de salida de los resultados de la consulta no cumple ninguna de las restricciones, se elimina del conjunto de resultados. Esto le permite garantizar que los umbrales mínimos de agregación se apliquen automáticamente y, al mismo tiempo, brinda flexibilidad a los colaboradores de datos que pueden escribir las consultas que deseen.
Regla de análisis de listas: la regla de análisis de listas permite ejecutar las consultas que extraen la lista de filas de la intersección de varios conjuntos de datos, como la superposición de dos conjuntos de datos. Al usar la regla de análisis de listas, puede hacer que solo se puedan ejecutar las consultas de lista en los datos y aplicar las restricciones a las consultas que se ejecutan, por ejemplo, qué columnas se deben usar solo en una coincidencia a ciegas y qué columnas se pueden mostrar como una lista en el resultado.
Regla de análisis personalizada: la regla de análisis personalizada permite crear consultas personalizadas con la mayoría del SQL estándar ANSI, como las expresiones de tabla comunes (CTE) y las funciones de ventana. También puede revisar y permitir las consultas antes de que los socios de colaboración las ejecuten, y revisar las consultas de otros colaboradores antes de que puedan ejecutarse en sus tablas. Al usar la regla de análisis personalizada, puede usar el control integrado para determinar o limitar, por adelantado, cómo se pueden analizar los datos subyacentes, en lugar de tener que confiar en los registros de consultas una vez finalizados los análisis. Al usar consultas de SQL personalizadas, también puede crear o usar plantillas de análisis para almacenar consultas personalizadas con parámetros en las colaboraciones. Esto permite a los clientes ayudarse unos a otros más fácilmente en una colaboración. Por ejemplo, un miembro que tenga más experiencia en SQL puede crear plantillas para que otros miembros las revisen y, posiblemente, las ejecuten. También facilita los análisis reutilizables en la colaboración. Además, puede utilizar la privacidad diferencial de AWS Clean Rooms seleccionando una regla de análisis personalizada y, a continuación, configurando los parámetros de privacidad diferencial.
Puede ejecutar consultas de AWS Clean Rooms en datos protegidos criptográficamente. Si tiene políticas de tratamiento de datos que requieren el cifrado de datos confidenciales, puede cifrarlos previamente mediante una clave de cifrado compartida y específica para cada colaboración, de modo que los datos queden cifrados incluso cuando se ejecuten las consultas. La computación criptográfica garantiza que los datos utilizados en las computaciones colaborativas permanezcan cifrados en reposo, en tránsito y en uso (mientras se procesan).
La computación criptográfica para Clean Rooms (C3R) es un SDK Java de código abierto con una CLI, disponible en GitHub. Esta característica se encuentra disponible sin ningún cargo adicional. Si dispone de macrodatos, puede revisar la documentación para ver cómo se puede integrar C3R en Apache Spark.
Esta característica es la última de una amplia gama de herramientas y servicios de computación criptográfica de AWS creados para ayudar a satisfacer sus necesidades de seguridad y conformidad, al tiempo que le permite aprovechar la flexibilidad, la escalabilidad, el rendimiento y la facilidad de uso que ofrece AWS.
ML que mejora la privacidad
Abrir todoAWS Clean Rooms ML le permite a usted y a sus socios aplicar tecnología de machine learning (ML) para mejorar la privacidad y generar información predictiva sin tener que compartir datos sin procesar entre sí. AWS Clean Rooms ML admite modelos de machine learning (ML) personalizados y similares. Con el modelado personalizado, puede incorporar un modelo personalizado para el entrenamiento y ejecutar inferencias en conjuntos de datos colectivos, sin compartir los datos subyacentes o la propiedad intelectual entre los colaboradores. Con el modelado similar, puede usar un modelo creado por AWS para generar un conjunto ampliado de perfiles similares a partir de una pequeña muestra de perfiles que sus socios aportan a una colaboración.
AWS Clean Rooms ML ayuda a los clientes con varios casos de uso. Por ejemplo, los anunciantes pueden incorporar su modelo y sus datos propios a una colaboración de Clean Rooms e invitar a los editores a unir sus datos para entrenar e implementar un modelo de machine learning personalizado que les ayude a aumentar la eficacia de la campaña; las instituciones financieras pueden utilizar los registros históricos de transacciones para entrenar un modelo de aprendizaje automático personalizado e invitar a los socios a una colaboración de Clean Rooms para detectar posibles transacciones fraudulentas; las instituciones de investigación y las redes hospitalarias pueden encontrar candidatos similares a los participantes de los ensayos clínicos actuales para ayudar a acelerar los ensayos clínicos estudios; y las marcas y los editores pueden modelar segmentos similares de clientes del mercado y ofrecer experiencias publicitarias muy relevantes, sin que ninguna de las empresas comparta sus datos subyacentes con la otra.
El modelado similar de AWS Clean Rooms ML, utilizando un modelo creado por AWS, se creó y probó en varios conjuntos de datos, como el comercio electrónico y la transmisión de video, y puede ayudarle a mejorar la precisión de los modelos similares en hasta un 36 %, en comparación con las bases de referencia representativas del sector. En aplicaciones del mundo real, como la prospección de nuevos clientes, esta mejora de la precisión puede traducirse en ahorros de millones de dólares.
AWS Clean Rooms le permite a usted y a sus socios generar conjuntos de datos sintéticos a partir de sus datos colectivos para entrenar modelos de machine learning (ML) de regresión y clasificación. AWS Clean Rooms ML aplica controles que mejoran la privacidad para ayudar a proteger sus datos patentados y modelos de machine learning y, al mismo tiempo, generar información predictiva. Como control que mejora la privacidad, la generación de conjuntos de datos sintéticos les permite a usted y a sus socios crear conjuntos de datos de entrenamiento con propiedades estadísticas similares a las del original, lo que permite trabajar con nuevos casos de uso de entrenamiento de modelos de machine learning para conjuntos de datos colectivos que antes estaban restringidos por motivos de privacidad de datos.
La generación de conjuntos de datos sintéticos con el objetivo de mejorar la privacidad para el machine learning personalizado en AWS Clean Rooms ML consiste en anular la identificación de sujetos (como personas o entidades sobre las que se recopilaron datos) en los datos originales, lo que reduce el riesgo de que un modelo memorice información sobre las personas del conjunto de datos. El proceso de generación de conjuntos de datos sintéticos está optimizado para crear conjuntos de datos compatibles con los algoritmos de regresión y clasificación de su elección.