Questions fréquentes (FAQ) sur AWS Clean Rooms

Questions d'ordre général

AWS Clean Rooms vous permet, ainsi qu'à vos partenaires, d'analyser plus facilement vos jeux de données collectifs et de collaborer plus aisément afin d'obtenir de nouvelles informations sans dévoiler les données sous-jacentes. Vous pouvez créer vos propres salles blanches en quelques minutes, et commencer à analyser vos jeux de données collectifs avec vos partenaires en quelques étapes. AWS Clean Rooms vous permet de collaborer facilement avec des centaines de milliers d'entreprises qui utilisent déjà AWS, sans devoir déplacer des données hors d'AWS ni les charger dans une autre plateforme.

Dans la console de gestion AWS, vous pouvez choisir le type d'analyse que vous souhaitez effectuer, les partenaires avec lesquels vous souhaitez collaborer et les jeux de données que vous souhaitez apporter à une collaboration. AWS Clean Rooms vous permet d'effectuer deux types d'analyses : les requêtes SQL et le machine learning.

Lorsque vous exécutez des requêtes SQL, AWS Clean Rooms lit les données là où elles se trouvent et applique des règles d'analyse intégrées et flexibles pour vous permettre de garder le contrôle de vos données. AWS Clean Rooms fournit un large éventail de contrôles SQL améliorant la confidentialité (y compris des contrôles de requête, des restrictions de sortie de requête et une journalisation des requêtes), ce qui vous permet de personnaliser les restrictions sur les requêtes exécutées par chaque participant. Vous pouvez utiliser la confidentialité différentielle (version préliminaire) d'AWS Clean Rooms en sélectionnant une règle d'analyse personnalisée et en configurant ensuite vos paramètres de confidentialité différentielle. La confidentialité différentielle vous aide à protéger la vie privée de vos utilisateurs grâce à des commandes intuitives et soutenues par des critères mathématiques en quelques clics. De plus, l'outil Cryptographic Computing for Clean Rooms (C3R) vous aide à maintenir le chiffrement des données sensibles lors de vos analyses SQL.

AWS Clean Rooms ML vous permet, à vous et à un partenaire, d’utiliser un machine learning (ML) qui améliore la confidentialité afin de générer des informations prédictives sans avoir à partager de données brutes entre vous. Avec la modélisation similaire d'AWS Clean Rooms ML, vous pouvez entraîner votre propre modèle personnalisé à l'aide de vos données et inviter vos partenaires à apporter un petit échantillon de leurs enregistrements dans le cadre d'une collaboration afin de générer un jeu étendu d'enregistrements similaires tout en protégeant vos données sous-jacentes et celles de votre partenaire. La modélisation des soins de santé sera disponible dans les prochains mois.

AWS Clean Rooms ML a été conçu et testé sur un large spectre de jeux de données, tels que le commerce électronique et le streaming vidéo, et peut aider les clients à améliorer la précision de modélisation similaire jusqu'à 36 %, par rapport aux données de référence représentatives du secteur. Dans des applications concrètes telles que la prospection de nouveaux clients, cette amélioration de la précision peut résulter sur des économies de plusieurs millions de dollars.

Les collaborations dans AWS Clean Rooms sont des limites logiques de sécurité qui permettent aux membres de la collaboration d'exécuter des requêtes SQL et de réaliser des modélisations ML sans partager de données brutes avec leurs partenaires. Seules les entreprises qui ont été conviées à la collaboration peuvent y participer. Plusieurs participants peuvent fournir des données dans le cadre d'une collaboration, mais un seul membre peut recevoir des résultats. Seules les entreprises invitées peuvent rejoindre une collaboration AWS Clean Rooms.

Vous pouvez utiliser la console de gestion AWS ou les opérations d'API pour créer une collaboration dans des salles blanches, inviter les entreprises avec lesquelles vous souhaitez collaborer et sélectionner les options de chaque participant au sein de la collaboration. Les participants peuvent ensuite définir des règles sur la manière dont les données structurées peuvent être interrogées et entraîner des modèles de machine learning sur leurs données. Les jeux de données ne sont pas copiés depuis les comptes des participants et ne sont accessibles qu'en cas de besoin. AWS Clean Rooms vous permet de choisir le type d'analyse que vous souhaitez effectuer : requêtes SQL et modélisation de ML à l'aide d'AWS Clean Rooms ML. Lorsque vous utilisez des requêtes SQL, vous bénéficiez également des fonctionnalités supplémentaires telles que le générateur d'analyse sans code, la confidentialité différentielle d'AWS Clean Rooms et le calcul cryptographique. Une fois que les participants à la collaboration ont associé des données ou des modèles à une collaboration et que les analyses ont été effectuées, les résultats de la collaboration seront stockés dans un compartiment Amazon Simple Storage Service (Amazon S3) désigné.

AWS Clean Rooms prend en charge jusqu'à cinq participants par collaboration.

Vous pouvez contrôler les personnes autorisées à participer à votre collaboration AWS Clean Rooms et vous pouvez créer une collaboration ou rejoindre une invitation à collaborer. La participation est transparente pour chaque membre d'une collaboration et, une fois la collaboration créée, aucun nouveau compte ne peut y être ajouté. Si nécessaire, vous pouvez toutefois configurer des nouvelles collaborations avec différents clients ou partenaires. Vous établissez et gérez les accès à votre contenu. Vous définissez également l'accès aux services et ressources AWS par les utilisateurs, les groupes, les autorisations et les informations d'identification que vous contrôlez.

Les clients peuvent générer des informations à l'aide de SQL ou de la modélisation AWS Clean Rooms ML sur leurs jeux de données collectifs avec leurs partenaires, sans partager ni révéler les données sous-jacentes.

Avec SQL, plusieurs participants peuvent fournir des données dans le cadre d'une collaboration, mais un seul peut exécuter des requêtes SQL, puis recevoir les résultats. Lorsqu'ils rejoignent une collaboration, les participants conviennent de la personne qui exécutera les requêtes, qui recevra les résultats et qui sera responsable des frais de calcul. Seules les personnes que vous invitez à cette collaboration peuvent obtenir des informations suivant les règles d'analyse que vous fixez. Lorsque vous configurez une collaboration AWS Clean Rooms, vous pouvez spécifier différentes options pour chaque membre de la collaboration en fonction de vos cas d'utilisation spécifiques. Par exemple, si vous souhaitez que le résultat de la requête soit envoyé à un autre membre, vous pouvez désigner un membre comme exécuteur de la requête (c'est lui qui écrit les requêtes) et un autre membre comme destinataire des résultats de la requête (c'est lui qui reçoit les résultats). Cela permet au créateur de la collaboration de s'assurer que le membre qui peut effectuer une requête n'a pas accès aux résultats de la requête.

Avec AWS Clean Rooms ML, un collaborateur apporte l'exemple du jeu d'enregistrements sur la base duquel il souhaite trouver des segments similaires auprès de son partenaire ; l'autre participant possède la part la plus importante à partir de laquelle nous générons des segments similaires en fonction de leur similarité avec les exemples d'enregistrements. AWS Clean Rooms ML enverra les segments similaires en sortie vers une destination spécifiée par le participant qui représente la plus grande part à partir de laquelle nous dérivons les segments similaires.

AWS Clean Rooms est un service indépendant de l'identité qui vous permet de faire correspondre vos données utilisateur avec celles de vos partenaires à l'aide d'une clé commune de votre choix (comme des identifiants pseudonymisés). Vous pouvez implémenter votre propre logique de correspondance dans SQL ou utiliser l'une de nos solutions partenaires. Vous pouvez utiliser AWS Entity Resolution pour harmoniser vos données de première partie afin de faciliter la correspondance dans le cadre d'une collaboration AWS Clean Rooms.

AWS Clean Rooms est disponible dans les régions suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Europe (Francfort), Europe (Irlande), Europe (Londres) et Europe (Stockholm).

Avec AWS Clean Rooms, vous pouvez utiliser des règles d'analyse SQL flexibles et un ML qui améliore la confidentialité pour répondre aux besoins de votre entreprise. Lorsque vous utilisez l'analyse SQL, vous pouvez choisir de manière flexible quel collaborateur paie pour la capacité de calcul des requêtes SQL exécutées dans le cadre d'une collaboration, sur une base par seconde (avec un tarif minimum de 60 secondes) d'heures d'unité de traitement dans les salles blanches (CRPU). Lorsque vous utilisez AWS Clean Rooms ML, vous ne payez que pour les entraînements de modèles que vous demandez et pour les segments similaires créés, sur la base d'un prix pour 1 000 profils. Pour plus d'informations, consultez Tarification d'AWS Clean Rooms.

AWS Clean Rooms ML

AWS Clean Rooms ML vous aide, vous et vos partenaires, à appliquer des modèles ML sur vos données collectives pour obtenir des informations prédictives sans partager d'informations sensibles entre vous. Grâce à cette fonctionnalité d'AWS Clean Rooms, vous pouvez inviter vos partenaires dans une salle blanche et appliquer un modèle de machine learning prêt à l'emploi géré par AWS, qui est entraîné de façon à ce que chaque collaboration génère des jeux de données similaires en quelques étapes, économisant ainsi des mois de travail de développement pour créer, entraîner, ajuster et déployer votre propre modèle.

AWS Clean Rooms ML aide les clients dans de nombreux cas d'utilisation. Par exemple, une compagnie aérienne peut utiliser les données concernant ses clients, collaborer avec un service de réservation en ligne et identifier des voyageurs potentiels présentant des caractéristiques similaires. Des loueurs et assureurs de voitures peuvent identifier des clients potentiels d'assurance automobile qui partagent des caractéristiques avec des entreprises de location existantes. De même, des marques et des éditeurs peuvent modéliser des segments similaires de clients sur le marché et proposer des expériences publicitaires très pertinentes, sans qu'aucune de ces sociétés ne partage ses données sous-jacentes avec l'autre. La modélisation des soins de santé sera disponible dans les prochains mois.

AWS Clean Rooms ML a été conçu et testé sur de nombreux jeux de données, tels que le commerce électronique et le streaming vidéo, et peut aider les clients à améliorer la précision de modélisation similaire jusqu'à 36 %, par rapport aux données de référence représentatives du secteur. Dans des applications concrètes telles que la prospection de nouveaux clients, cette amélioration de la précision peut résulter sur des économies de plusieurs millions de dollars.

Avec la modélisation similaire d'AWS Clean Rooms ML, vous pouvez entraîner votre propre modèle personnalisé à l'aide de vos données et inviter vos partenaires à apporter un petit échantillon de leurs enregistrements dans le cadre d'une collaboration afin de générer un jeu étendu d'enregistrements similaires tout en protégeant vos données sous-jacentes et celles de votre partenaire. AWS Clean Rooms ML prélève un petit échantillon d'enregistrements provenant d'une partie et trouve un jeu d'enregistrements beaucoup plus important, ou un segment similaire, à partir du jeu de données d'un autre participant. AWS Clean Rooms ML ne partage de données avec aucune des parties, et les parties peuvent supprimer leurs données ou supprimer un modèle personnalisé quand elles le souhaitent. Vous pouvez spécifier la taille souhaitée du segment similaire obtenu. AWS Clean Rooms ML associera en privé les profils uniques de votre liste d'échantillons à ceux du jeu de données de votre partenaire, puis entraînera un modèle de ML qui prédit dans quelle mesure chaque profil du jeu de données de votre collaborateur est similaire à ceux de votre échantillon. AWS Clean Rooms ML regroupera automatiquement les profils similaires à la liste d'exemples et produira le segment similaire qui en résulte. AWS Clean Rooms ML élimine le besoin de partager des données pour créer, entraîner et déployer des modèles ML avec vos partenaires. Avec AWS Clean Rooms ML, vos données ne sont utilisées que pour entraîner votre modèle et ne servent pas à entraîner des modèles AWS. Vous pouvez utiliser des commandes intuitives qui vous aident, vous et vos partenaires, à ajuster les résultats prédictifs du modèle.

Sécurité et protection des données

La protection des données commence par la base de sécurité d'AWS, et AWS Clean Rooms repose sur les services de sécurité AWS, notamment AWS Identity and Access Management (IAM), AWS Key Management Service (AWS KMS) et AWS CloudTrail. Cela vous permet d'étendre votre stratégie de protection des données existante aux charges de travail de collaboration en matière de données. Avec AWS Clean Rooms, il n'est plus nécessaire de stocker ou de conserver une copie de vos données à l'extérieur de votre environnement AWS ni de les envoyer à un autre membre pour effectuer une analyse en vue d'obtenir des informations sur les consommateurs, des mesures marketing, des prévisions ou une évaluation des risques.

Lorsque vous configurez une collaboration AWS Clean Rooms et que vous utilisez l'analyse SQL, vous pouvez spécifier différentes options pour chaque membre de la collaboration en fonction de vos cas d'utilisation spécifiques. Par exemple, si vous souhaitez que le résultat de la requête soit envoyé à un autre membre, vous pouvez désigner un membre comme exécuteur de la requête (c'est lui qui écrit les requêtes) et un autre membre comme destinataire des résultats de la requête (c'est lui qui reçoit les résultats). Cela permet au créateur de la collaboration de s'assurer que le membre qui peut effectuer une requête n'a pas accès aux résultats de la requête.

AWS Clean Rooms propose également des contrôles de requêtes SQL qui vous permettent de limiter le type des requêtes ou les requêtes spécifiques qui peuvent être exécutées sur vos tables de données au moyen de la configuration de règles d'analyse. AWS Clean Rooms prend en charge trois types de règles d'analyse SQL : agrégation, liste et personnalisée. La règle d'analyse d'agrégation vous permet de configurer votre table de manière à n'autoriser que les requêtes qui génèrent des statistiques agrégées (comme l'attribution ou la mesure de campagnes). La règle d'analyse de liste vous permet de configurer vos contrôles de sorte que les requêtes ne puissent analyser que l'intersection entre vos jeux de données et ceux du membre autorisé à exécuter des requêtes. La règle d'analyse personnalisée vous permet de configurer des contrôles au niveau des requêtes pour autoriser l'exécution de comptes ou de requêtes spécifiques sur votre jeu de données. Lorsque vous utilisez des règles d'analyse personnalisées, vous pouvez choisir d'utiliser la confidentialité différentielle. En quelques étapes seulement, la confidentialité différentielle d'AWS Clean Rooms vous permet de protéger la vie privée de vos utilisateurs grâce à des commandes intuitives basées sur des critères mathématiques. En tant que fonctionnalité entièrement gérée d’AWS Clean Rooms, aucune expérience préalable en matière de confidentialité différentielle n’est requise pour empêcher la réidentification de vos utilisateurs. Les seuils d'agrégation constituent un autre moyen de contrôle, qui empêchent les requêtes d'accéder à de petits groupes potentiellement réidentifiables.

Avec AWS Clean Rooms ML, vos données ne sont utilisées que pour entraîner votre modèle et ne servent pas à entraîner des modèles AWS. AWS Clean Rooms ML n'utilise pas les données d'entraînement ou de segment similaires d'une entreprise avec d'autres, et vous pouvez supprimer votre modèle et vos données d'entraînement quand vous le souhaitez.

Non. Les jeux de données sont stockés sur les comptes AWS des participants. AWS Clean Rooms lit temporairement les données des comptes des membres pour exécuter des requêtes, entraîner des modèles de machine learning ou développer des segments d'amorçage. Les résultats d'une analyse sont envoyés à l'emplacement S3 conçu pour l'analyse.

Les modèles générés par AWS Clean Rooms ML sont stockés par le service, peuvent être chiffrés à l'aide d'une clé AWS KMS gérée par le client et peuvent être supprimés par le client à tout moment.

Les règles d'analyse et de chiffrement d'AWS Clean Rooms vous permettent de contrôler, avec précision, le type d'informations que vous souhaitez partager. En tant que collaborateur participant à une collaboration en matière de données, il vous revient d'évaluer les risques de chaque collaboration, notamment ceux associés à la réidentification, et de faire preuve de toute la diligence raisonnable pour garantir la conformité avec les lois en matière de confidentialité des données. Si les données que vous partagez sont sensibles ou réglementées, nous vous recommandons d'utiliser également des accords juridiques et des mécanismes d'audit appropriés afin de réduire davantage les risques pour la vie privée.

Oui. Les conditions de service AWS interdisent certains cas d'utilisation pour les collaborations dans AWS Clean Rooms.

Oui. Le programme de conformité HIPAA d'AWS comprend AWS Clean Rooms en tant que service éligible HIPAA. Si vous avez signé un addenda de partenariat commercial (BAA) avec AWS, vous pouvez désormais utiliser AWS Clean Rooms pour créer des collaborations conformes à la loi HIPAA. Si vous n'avez pas de BAA ou si vous avez d'autres questions sur l'utilisation d'AWS avec des applications conformes HIPAA, contactez-nous pour obtenir plus d'informations. Pour en savoir plus, consultez Conformité HIPAA d'AWS et AWS pour la santé et les sciences de la vie.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Analyses SQL

Dans les règles d'analyse SQL, vous configurez des contrôles au niveau des colonnes qui vous aident à définir la façon dont chaque colonne est utilisée dans des requêtes. Vous pouvez, par exemple, spécifier les colonnes qui peuvent être utilisées pour calculer des statistiques agrégées, comme SUM(price), et celles qui peuvent l'être pour joindre votre table à d'autres membres de la collaboration. Dans la règle d'analyse d'agrégation, vous pouvez également définir un seuil minimal d'agrégation que doit respecter chaque ligne de sortie. Les lignes qui ne respectent pas ce seuil minimal sont automatiquement exclues par AWS Clean Rooms.

Oui. Vous aurez la possibilité de configurer AWS Clean Rooms pour qu'il publie des journaux de requêtes dans Amazon CloudWatch Logs. Avec la règle d'analyse personnalisée, vous pouvez également consulter les requêtes (stockées dans les modèles d'analyse) avant qu'elles ne soient exécutées dans le cadre de la collaboration. 

Confidentialité différentielle d'AWS Clean Rooms

La confidentialité différentielle est un cadre mathématiquement éprouvé qui contribue à la protection de la confidentialité des données. Le principal avantage de la confidentialité différentielle est de permettre la protection des données au niveau individuel en ajoutant une quantité contrôlée de caractère aléatoire (bruit) afin de masquer la présence ou l'absence d'un individu dans un jeu de données en cours d'analyse.

En quelques étapes seulement, la confidentialité différentielle d'AWS Clean Rooms vous permet de protéger la vie privée de vos utilisateurs grâce à des commandes intuitives basées sur des critères mathématiques. En tant que fonctionnalité entièrement gérée d’AWS Clean Rooms, aucune expérience préalable en matière de confidentialité différentielle n’est requise pour empêcher la réidentification de vos utilisateurs. La confidentialité différentielle d'AWS Clean Rooms masque la contribution des données de tout individu en générant des informations agrégées dans le cadre de collaborations, afin que vous puissiez exécuter un large éventail de requêtes SQL pour générer des informations sur les campagnes publicitaires, les décisions d'investissement, les recherches cliniques, etc.

Vous pouvez commencer à utiliser la confidentialité différentielle d'AWS Clean Rooms en quelques étapes seulement après avoir démarré ou rejoint une collaboration AWS Clean Rooms en tant que membre ayant l'option de fournir des données. Après avoir créé une table configurée, qui fait référence à votre table dans le catalogue de données AWS Glue, il vous suffit de choisir d'activer la confidentialité différentielle tout en ajoutant une règle d'analyse personnalisée à cette table configurée. Ensuite, vous associez la table configurée à votre collaboration AWS Clean Rooms et vous configurez une politique de confidentialité différentielle dans la collaboration afin de rendre votre table disponible pour des requêtes. Vous pouvez utiliser une politique par défaut pour terminer rapidement la configuration ou la personnaliser en fonction de vos besoins spécifiques.

Une fois que la confidentialité différentielle d'AWS Clean Rooms est configurée, votre partenaire de collaboration peut commencer à exécuter des requêtes sur votre table, sans avoir besoin d'aucune expertise en matière de concepts de confidentialité différentielle ni de configuration supplémentaire de la part de ses partenaires. Avec la confidentialité différentielle d'AWS Clean Rooms, les exécuteurs de requêtes peuvent exécuter des analyses personnalisées et flexibles, notamment des modèles de requêtes complexes avec des expressions de table communes (CTE) et des fonctions d'agrégation couramment utilisées comme COUNT et SUM.

Calcul cryptographique

Le calcul cryptographique est une méthode destinée à protéger et chiffrer les données sensibles lorsqu'elles sont utilisées. Les données sont chiffrées au repos lorsqu'elles sont stockées, et en mouvement lorsqu'elles sont transmises et lorsqu'elles sont utilisées. Le chiffrement consiste à convertir des données en texte brut en données codées qui peuvent uniquement être déchiffrées avec une « clé » spécifique. PSI (Private Set Intersection) est un type de calcul cryptographique qui permet à plusieurs parties détenant des jeux de données de comparer des versions chiffrées afin d'effectuer le calcul. Le chiffrement s'effectue sur site avec la clé secrète partagée du collaborateur.

AWS Clean Rooms comprend C3R, qui offre la possibilité d'effectuer un chiffrement préalable des données à l'aide d'un outil de chiffrement côté client (un kit SDK ou une interface de ligne de commande [CLI]) qui utilise une clé secrète partagée avec d'autres participants dans le cadre d'une collaboration AWS Clean Rooms. Les données sont chiffrées à mesure que les requêtes sont exécutées.