Preguntas frecuentes sobre AWS Clean Rooms

Aspectos generales

AWS Clean Rooms le facilita a usted y a sus socios el análisis y la colaboración en sus conjuntos de datos colectivos para obtener nuevas perspectivas sin relevar los datos subyacentes a los demás. Puede utilizar AWS Clean Rooms para crear sus propias salas limpias en cuestión de minutos y comenzar a analizar sus conjuntos de datos colectivos con tan solo unos pasos. Con AWS Clean Rooms, puede colaborar fácilmente con cientos de miles de empresas que ya utilizan AWS sin necesidad de trasladar datos fuera de AWS o cargarlos en otra plataforma.

Las colaboraciones de AWS Clean Rooms son límites lógicos seguros que permiten a los miembros de la colaboración ejecutar consultas SQL y realizar modelos de ML sin compartir datos sin procesar con sus socios. Únicamente las empresas que han sido invitadas a la colaboración podrán unirse. Varios participantes pueden aportar datos a una colaboración, mientras que un miembro puede consultar datos y recibir resultados. Solo las empresas que hayan sido invitadas pueden unirse a una colaboración de AWS Clean Rooms.

Desde la Consola de administración de AWS, puede elegir el tipo de análisis que desea realizar, los socios con los que desea colaborar y los conjuntos de datos con los que desea contribuir a una colaboración. Con AWS Clean Rooms, puede realizar dos tipos de análisis: consultas SQL y machine learning.

Cuando ejecuta consultas con SQL o Spark SQL, AWS Clean Rooms lee los datos donde residen y aplica reglas de análisis integradas y flexibles para ayudarlo a mantener el control sobre sus datos. AWS Clean Rooms proporciona un amplio conjunto de controles de mejora de la privacidad, como controles de consultas, restricciones de salida de consultas y registro de consultas, que le permiten personalizar las restricciones de las consultas ejecutadas por cada participante de la sala limpia. Puede utilizar el motor de análisis de Spark para ejecutar consultas con el dialecto SQL de Spark en las colaboraciones de AWS Clean Rooms. AWS Clean Rooms Spark SQL ofrece tamaños de procesamiento configurables para brindar una mayor flexibilidad para personalizar y asignar recursos para ejecutar consultas de SQL en función de sus requisitos de rendimiento, escala y costo. AWS Clean Rooms Spark SQL solo está disponible para las reglas de análisis personalizadas. AWS Clean Rooms Differential Privacy lo ayuda a proteger la privacidad de sus usuarios con controles intuitivos y respaldados matemáticamente en unos pocos clics. Con el motor de análisis de SQL, puede utilizar AWS Clean Rooms Differential Privacy al seleccionar una regla de análisis personalizada de SQL y, a continuación, configurar los parámetros de privacidad diferencial que desea. Además, la computación criptográfica para Clean Rooms (C3R) le ayuda a mantener cifrados los datos confidenciales durante su análisis de SQL cuando utiliza el motor de análisis de Spark o el motor de análisis de SQL para ejecutar sus consultas. Para aplicar la privacidad diferencial de AWS Clean Rooms o utilizar reglas de agregación y lista de análisis en una colaboración, debe usar SQL como el motor de análisis.

AWS Clean Rooms ML los ayudan a usted y a sus socios a aplicar el machine learning (ML) que mejora la privacidad para generar información predictiva sin tener que compartir datos sin procesar entre sí. Con el modelado de apariencia similar de AWS Clean Rooms ML, puede entrenar su propio modelo personalizado con sus datos e invitar a sus socios a aportar una pequeña muestra de sus registros para una colaboración a fin de generar un conjunto ampliado de registros similares y, al mismo tiempo, proteger sus datos subyacentes y los de su socio. Los modelos para los servicios sanitarios estarán disponibles en los próximos meses.

AWS Clean Rooms ML se creó y probó en una amplia variedad de conjuntos de datos, como el comercio electrónico y la transmisión de video, y puede ayudar a los clientes a mejorar la precisión de los modelos similares en hasta un 36 %, en comparación con las bases de referencia representativas del sector. En aplicaciones del mundo real, como la prospección de nuevos clientes, esta mejora de la precisión puede traducirse en ahorros de millones de dólares.

Mediante la Consola de administración de AWS o las operaciones de la API puede crear una colaboración de sala limpia, invitar a las empresas con las que desee colaborar y seleccionar un participante de la colaboración que pueda ejecutar los análisis dentro de la colaboración. Luego, los participantes pueden configurar reglas sobre cómo se consultar los datos estructurados y entrenar modelos de ML con sus datos. Los conjuntos de datos no se copian de las cuentas de los participantes y solo se accede a ellos cuando es necesario. Con AWS Clean Rooms, puede elegir el tipo de análisis que desea realizar: consultas SQL y modelado de ML mediante AWS Clean Rooms ML. Al usar consultas SQL, también utiliza capacidades adicionales, como el generador de análisis sin código, la privacidad diferencial de AWS Clean Rooms y la computación criptográfica. Una vez que los participantes de la colaboración hayan asociado los datos o los modelos a una colaboración y se hayan realizado los análisis, los resultados de la colaboración se almacenarán en un bucket designado de Amazon Simple Storage Service (Amazon S3).

AWS Clean Rooms admite hasta cinco participantes por colaboración.

Puede controlar quién participa en su colaboración de AWS Clean Rooms, así como crear una colaboración o unirse a una invitación para colaborar. La participación es transparente para todas las partes de una colaboración, por lo que no se podrán agregar nuevas cuentas después de crear la colaboración. Sin embargo, es posible establecer nuevas colaboraciones con diferentes clientes o socios si es necesario. Establece y administra el acceso a su contenido, así como también configura el acceso a los servicios y recursos de AWS a través de usuarios, grupos, permisos y credenciales que están bajo su control.

Los clientes pueden generar información mediante el modelado de ML de SQL o AWS Clean Rooms en sus conjuntos de datos colectivos con sus socios, sin compartir ni revelar los datos subyacentes.

Con SQL, varios colaboradores pueden aportar datos, pero solo un colaborador puede realizar consultas SQL y solo uno puede recibir los resultados. Al unirse a una colaboración, los colaboradores acuerdan quién realizará las consultas, quién recibirá los resultados y quién será responsable de los gastos de cálculo. Solo aquellos a quienes invite a la colaboración pueden obtener información basada en las reglas de análisis que establezca. Al configurar una colaboración de AWS Clean Rooms, puede especificar diferentes capacidades para cada miembro de la colaboración para adaptarlas a sus casos de uso específicos. Por ejemplo, si desea que el resultado de la consulta vaya a un miembro diferente, puede designar a un miembro como ejecutor de consultas que puede escribirlas y a otro miembro como receptor de resultados de consultas que puede recibirlos. Esto permite al creador de la colaboración asegurarse de que el miembro que puede realizar consultas no tenga acceso a los resultados de la consulta.

Con AWS Clean Rooms ML, un colaborador aporta el conjunto de registros de muestra en función del cual desea encontrar segmentos similares de su socio; la otra parte tiene la población más grande a partir de la cual generamos segmentos similares en función de su similitud con los registros de muestra. AWS Clean Rooms ML enviará los segmentos similares de salida a un destino especificado por la parte que tenga la población más grande de la que derivamos los segmentos similares.

AWS Entity Resolution está integrado de forma nativa en AWS Clean Rooms. Puede utilizar la comparación basada en reglas o en proveedores de servicios de datos para preparar, emparejar y vincular sus datos de usuario con los de su socio con cualquier clave común que elija usar (como identificadores seudonimizados) dentro de una colaboración de AWS Clean Rooms con mayor privacidad.

AWS Clean Rooms está disponible en el Este de EE. UU. (Ohio), Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón), Asia-Pacífico (Seúl), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Tokio), Europa (Fráncfort), Europa (Irlanda), Europa (Londres) y Europa (Estocolmo).

Con AWS Clean Rooms, puede utilizar reglas de análisis de SQL flexibles y ML que mejoren la privacidad para satisfacer sus necesidades empresariales. Cuando usa el análisis SQL, puede elegir de manera flexible qué colaborador paga por la capacidad de cómputo de las consultas SQL que se ejecutan en una colaboración, en una unidad de procesamiento de salas limpias (CRPU): horas por segundo (con un cargo mínimo de 60 segundos). Cuando utiliza AWS Clean Rooms ML, solo paga por las capacitaciones sobre modelos que solicite y por los segmentos similares creados, con un precio por cada 1000 perfiles. Para obtener más información, consulte los precios de AWS Clean Rooms.

Con AWS Entity Resolution en AWS Clean Rooms, puede utilizar la coincidencia basada en reglas o en el proveedor de servicios de datos para aprovechar los conjuntos de datos de los proveedores (como LiveRamp).

Cuando utiliza la comparación basada en reglas, al menos un miembro de una colaboración debe preparar sus datos antes de compararlos con los conjuntos de datos de sus socios, a menos que ya haya preparado sus datos con AWS Entity Resolution antes de crear la colaboración o unirse a ella. Este miembro pagará por la preparación de los datos solo si se utilizan. Cualquier miembro que participe en una colaboración puede pagar por la comparación de datos. La comparación de datos también requiere una tarifa única por colaboración; esta tarifa se asigna a cualquier colaborador que pague por la comparación de datos.

Cuando utiliza la comparación basada en el proveedor de servicios de datos, todos los miembros de la colaboración deben tener una suscripción de proveedor para preparar sus datos con los ID de proveedor. Todos los miembros de la colaboración deben preparar sus datos con los ID de proveedor antes de compararlos con los conjuntos de datos de sus socios, a menos que ya hayan preparado sus datos con AWS Entity Resolution antes de crear la colaboración o unirse a ella. Cualquier miembro que participe en una colaboración puede pagar la comparación de datos con las identificaciones de los proveedores. Además, el miembro que paga por la comparación de datos debe tener una suscripción de proveedor. Puede utilizar las suscripciones públicas que figuran en AWS Data Exchange (ADX) o comprar una suscripción privada directamente en el proveedor de servicios de datos de su elección y, a continuación, utilizar la característica Use su propia suscripción (BYOS) en ADX. 

Para más información, consulte los precios de AWS Entity Resolution en AWS Clean Rooms.

AWS Clean Rooms ML

AWS Clean Rooms ML lo ayuda a usted y a sus socios a aplicar modelos de ML en sus datos colectivos para obtener información predictiva sin compartir información confidencial entre sí. Con esta capacidad de AWS Clean Rooms, puede invitar a sus socios a una sala limpia y aplicar un modelo de ML administrado por AWS listo para usar que se alimente de cada colaboración y genere conjuntos de datos similares en unos pocos pasos, ahorrando meses de trabajo de desarrollo para crear, entrenar, ajustar e implementar su propio modelo.

AWS Clean Rooms ML ayuda a los clientes con múltiples casos de uso. Por ejemplo, una aerolínea puede aprovechar los datos sobre sus clientes, colaborar con un servicio de reservas en línea e identificar posibles viajeros con características similares, los prestamistas y aseguradoras de automóviles pueden identificar a los posibles clientes de seguros de automóviles que comparten características con un conjunto de propietarios de arrendamientos existentes, y las marcas y editores pueden modelar segmentos similares de clientes del mercado y ofrecer experiencias publicitarias muy relevantes, sin que las empresas compartan sus datos subyacentes. Los modelos para los servicios sanitarios estarán disponibles en los próximos meses.

AWS Clean Rooms ML se creó y probó en una amplia variedad de conjuntos de datos, como el comercio electrónico y la transmisión de video, y puede ayudar a los clientes a mejorar la precisión de los modelos similares en hasta un 36 %, en comparación con las bases de referencia representativas del sector. En aplicaciones del mundo real, como la prospección de nuevos clientes, esta mejora de la precisión puede traducirse en ahorros de millones de dólares.

Con el modelado de apariencia similar de AWS Clean Rooms ML, puede entrenar su propio modelo personalizado con sus datos e invitar a sus socios a aportar una pequeña muestra de sus registros para una colaboración a fin de generar un conjunto ampliado de registros similares y, al mismo tiempo, proteger sus datos subyacentes y los de su socio. AWS Clean Rooms ML toma una pequeña muestra de registros de una parte y encuentra un conjunto de registros mucho más grande o un segmento similar del conjunto de datos de otro colaborador. AWS Clean Rooms ML no comparte datos con ninguna de las partes, y las partes pueden eliminar sus datos o eliminar un modelo personalizado cuando lo deseen. Puede especificar el tamaño deseado del segmento similar resultante y AWS Clean Rooms ML comparará de forma privada los perfiles únicos de su lista de muestra con los del conjunto de datos de su socio y, a continuación, entrenará un modelo de ML que prediga la similitud de cada perfil del conjunto de datos de su colaborador con los de su muestra. AWS Clean Rooms ML agrupará automáticamente los perfiles que sean similares a la lista de muestras y generará el segmento similar resultante. AWS Clean Rooms ML elimina la necesidad de compartir datos para crear, entrenar e implementar modelos de ML con sus socios. Con AWS Clean Rooms ML, sus datos solo se utilizan para entrenar su modelo y no para el entrenamiento de modelos de AWS. Puede utilizar controles intuitivos que los ayudan a usted y a sus socios a ajustar los resultados predictivos del modelo.

Seguridad y protección de datos

La protección de datos comienza con la base de seguridad de AWS, y AWS Clean Rooms se basa en los servicios de seguridad de AWS, incluidos AWS Identity and Access Management (IAM), AWS Key Management Service (KMS) y AWS CloudTrail. Esto le permite extender su estrategia de protección de datos actual a las cargas de trabajo de colaboración de datos. Gracias a AWS Clean Rooms, ya no tendrá que almacenar los datos ni mantener una copia fuera del entorno de AWS, ni enviarlos a terceros para realizar análisis con el fin de obtener información sobre los consumidores, realizar mediciones de marketing, hacer previsiones o evaluar riesgos.

Al configurar una colaboración de AWS Clean Rooms y utilizar el análisis de SQL, puede especificar diferentes capacidades para cada miembro de la colaboración para que se adapten a sus casos de uso específicos. Por ejemplo, si desea que el resultado de la consulta vaya a otro miembro, puede designar a un miembro como el ejecutor de la consulta que puede escribirlas y a otro miembro como el receptor de los resultados de la consulta que puede recibirlos. Esto permite al creador de la colaboración asegurarse de que el miembro que puede realizar consultas no tenga acceso a los resultados de la consulta.

Con AWS Clean Rooms puede proteger los datos, pues le permite restringir el tipo de consultas o consultas específicas que se pueden ejecutar en sus tablas de datos mediante la configuración de reglas de análisis. AWS Clean Rooms admite tres tipos de reglas de análisis: agregación, lista y personalizadas. Las reglas de análisis de agregación sirven para configurar la tabla de manera que solo se permitan las consultas que generen estadísticas agregadas (como la atribución o la medición de campañas). Las reglas de análisis de lista permiten configurar los controles de manera que las consultas únicamente puedan analizar el punto de intersección de sus conjuntos de datos con los de los miembros que pueden realizar consultas. Con la regla de análisis personalizada, puede configurar los controles a nivel de consulta para permitir que se ejecuten cuentas o consultas específicas en su conjunto de datos. Al utilizar reglas de análisis personalizadas, puede optar por utilizar la privacidad diferencial. La privacidad diferencial de AWS Clean Rooms lo ayuda a proteger la privacidad de sus usuarios con controles intuitivos y respaldados matemáticamente en unos pocos clics. Al ser una capacidad totalmente gestionada de AWS Clean Rooms, no se necesita experiencia previa en privacidad diferencial para ayudarlo a evitar la reidentificación de sus usuarios. Otro control son los umbrales de agregación, que impiden que las consultas se extraigan en grupos pequeños que podrían volver a identificarse.

Con AWS Clean Rooms ML, sus datos solo se utilizan para entrenar su modelo y no para el entrenamiento de modelos de AWS. AWS Clean Rooms ML no utiliza los datos de segmentos de capacitación o similares de ninguna empresa con otra y puede eliminar sus datos de modelo y capacitación cuando lo desee.

No. Los conjuntos de datos se almacenan en las cuentas de AWS de los colaboradores. AWS Clean Rooms lee temporalmente los datos de las cuentas de los colaboradores para ejecutar consultas, emparejar registros, entrenar modelos de machine learning o ampliar los segmentos iniciales. Los resultados de un análisis se envían a la ubicación S3 diseñada para el análisis.

AWS Entity Resolution e AWS Clean Rooms genera un conjunto de datos que asigna los identificadores de todas las partes en una colaboración. AWS Clean Rooms administra el conjunto de datos de asignación. Ningún miembro de la colaboración puede ver o descargar la tabla de asignación. Si todos los miembros de la colaboración están de acuerdo en flexibilizar esta medida de privacidad, pueden consultar la tabla de asignación para casos prácticos particulares. Cualquiera de las partes puede eliminar la tabla en cualquier momento.

El servicio almacena los modelos generados por AWS Clean Rooms ML, se pueden cifrar con una clave de AWS KMS administrada por el cliente y el cliente puede eliminarlos en cualquier momento.

Las reglas de análisis y cifrado de AWS Clean Rooms permiten ejercer un control preciso sobre el tipo de información que se desea compartir. Como colaborador de datos, es responsable de evaluar el riesgo que conlleva cada colaboración, incluido el riesgo de reidentificación, y de llevar a cabo una diligencia debida adicional para garantizar que se cumple con todas las leyes en materia de privacidad de datos. Si los datos que comparte son confidenciales o están sujetos a regulaciones, recomendamos que también utilice acuerdos legales y mecanismos de auditoría apropiados para reducir aún más los riesgos de privacidad.

Sí. Las Condiciones de servicio de AWS prohíben determinados casos de uso para colaboraciones en AWS Clean Rooms.

Sí, el programa de AWS de conformidad con la HIPAA incluye AWS Clean Rooms como un servicio que cumple con los requisitos de la HIPAA. Si ha firmado un acuerdo de asociación empresarial (BAA) con AWS, ahora puede utilizar AWS Clean Rooms para crear colaboraciones que cumplan con la HIPAA. Si no tiene un BAA o si tiene otras preguntas acerca del uso de AWS en sus aplicaciones en conformidad con HIPAA, contacte con nosotros para obtener más información.

Para obtener más información, consulte los siguientes recursos:

La página Conformidad con HIPAA de AWS

La página Computación en la nube de AWS en el sector de la sanidad

Análisis SQL

Puede optar por utilizar el motor de análisis de Spark para ejecutar consultas con el dialecto SQL de Spark en las colaboraciones de AWS Clean Rooms. AWS Clean Rooms Spark SQL ofrece tamaños de procesamiento configurables para proporcionar un mayor control sobre el rendimiento de precio al ejecutar cargas de trabajo de SQL. Para aplicar la privacidad diferencial de AWS Clean Rooms o utilizar reglas de agregación y lista de análisis en una colaboración, debe usar SQL como el motor de análisis.

AWS Clean Rooms Spark SQL usa el tipo de instancia predeterminado CR.1X, que proporciona 4 CPU virtuales, 30 GB de memoria y 100 GB de almacenamiento. Puede optar por asignar más recursos para ejecutar sus cargas de trabajo de Spark SQL al seleccionar el tipo de instancia CR.4X más grande, que proporciona 16 CPU virtuales, 120 GB de memoria y 400 GB de almacenamiento. Los tamaños de instancia más grandes pueden beneficiar a las cargas de trabajo de SQL que procesan grandes volúmenes de datos y realizan análisis complejos, lo que ayuda a distribuir las cargas de trabajo entre una mayor cantidad de recursos. Obtenga más información sobre CPU virtuales, la memoria y el almacenamiento asociados a cada configuración aquí.

En las reglas de análisis, configure controles a nivel de columna que le ayudan a definir cómo se puede utilizar cada columna a la hora de realizar consultas. Por ejemplo, es posible especificar qué columnas se pueden utilizar para calcular estadísticas agregadas, como SUM(price), y qué columnas se pueden utilizar para unir la tabla con otros miembros de la colaboración. En las reglas de análisis de agregación, también se puede definir un umbral mínimo de agregación que debe cumplir cada fila de salida. AWS Clean Rooms excluirá automáticamente las filas que no cumplan el umbral mínimo.

Sí. Podrá configurar AWS Clean Rooms para publicar registros de consulta en Registros de Amazon CloudWatch. Con la regla de análisis personalizada, también puede revisar las consultas (almacenadas en plantillas de análisis) antes de que se ejecuten en la colaboración. 

Privacidad diferencial de AWS Clean Rooms

La privacidad diferencial es un marco matemáticamente probado que ayuda a la protección de la privacidad de los datos. El principal beneficio de la privacidad diferencial es que ayuda a proteger los datos a nivel individual al agregar una cantidad controlada de aleatoriedad (ruido) para ocultar la presencia o ausencia de un solo individuo en un conjunto de datos que se está analizando.

La privacidad diferencial de AWS Clean Rooms lo ayuda a proteger la privacidad de sus usuarios con controles intuitivos y respaldados matemáticamente en unos pocos pasos. Al ser una capacidad totalmente gestionada de AWS Clean Rooms, no se necesita experiencia previa en privacidad diferencial para ayudarlo a evitar la reidentificación de sus usuarios. La privacidad diferencial de AWS Clean Rooms oculta la contribución de los datos de cualquier persona a la hora de generar información agregada en las colaboraciones, de modo que puede ejecutar una amplia gama de consultas de SQL para generar información sobre campañas publicitarias, decisiones de inversión, investigaciones clínicas y más.

Puede empezar a utilizar la privacidad diferencial de AWS Clean Rooms con unos pocos pasos después de iniciar o unirse a una colaboración de AWS Clean Rooms como miembro con capacidad para aportar datos. Una vez que haya creado una tabla configurada, que es una referencia a su tabla en el catálogo de datos de AWS Glue, simplemente elija activar la privacidad diferencial y, al mismo tiempo, añadir una regla de análisis personalizada a la tabla configurada cuando utilice el motor de análisis SQL. A continuación, asocie la tabla configurada a su colaboración de AWS Clean Rooms y configure una política de privacidad diferencial en la colaboración para que la tabla esté disponible para consultas. Puede usar una política predeterminada para completar rápidamente la configuración o personalizarla para cumplir con sus requisitos específicos. Para aplicar la privacidad diferencial de AWS Clean Rooms en una colaboración, debe usar SQL como el motor de análisis.

Una vez que se haya configurado la privacidad diferencial de AWS Clean Rooms, su socio de colaboración podrá empezar a ejecutar consultas en su tabla, sin necesidad de que sus socios tengan experiencia en conceptos de privacidad diferencial ni configuraciones adicionales. Con la privacidad diferencial de AWS Clean Rooms, los ejecutores de consultas pueden ejecutar análisis personalizados y flexibles, incluidos patrones de consulta complejos con expresiones comunes de tabla (CTE) y funciones agregadas de uso común, como COUNT y SUM.

Computación criptográfica

La computación criptográfica es un método para proteger y cifrar datos confidenciales mientras se utilizan. Los datos se pueden cifrar en reposo cuando se almacenan, en tránsito cuando se transmiten y cuando se utilizan. El cifrado consiste en convertir los datos que se encuentran en texto plano en datos codificados que no se pueden descifrar sin una “clave” específica. La intersección de conjuntos privados (PSI) es un tipo de computación criptográfica que permite a dos o más partes que poseen conjuntos de datos comparar versiones cifradas para realizar computaciones. El cifrado se efectúa en el entorno en las instalaciones con la clave secreta compartida del colaborador. C3R está disponible tanto para el motor de análisis SQL de Spark como para el motor de análisis de SQL.

AWS Clean Rooms incluye computación criptográfica para salas limpias (C3R), que ofrece la posibilidad de cifrar previamente los datos mediante una herramienta de cifrado del cliente, ya sea un SDK o una interfaz de la línea de comandos (CLI), que utiliza una clave secreta compartida con otros participantes en una colaboración de AWS Clean Rooms. Esto cifra los datos a medida que se ejecutan las consultas.