- Analytique›
- AWS Clean Rooms›
- Fonctionnalités
Fonctionnalités AWS Clean Rooms
Créez des salles blanches en quelques minutes. Collaborez avec vos partenaires sans partager de données brutes
Pourquoi choisir AWS Clean Rooms ?
Créez votre propre salle blanche, ajoutez des participants et commencez à collaborer en quelques étapes
Collaborez avec n’importe quelle entreprise sans partager ni révéler les données sous‑jacentes
Protection des données sous-jacentes grâce à un large éventail de contrôles améliorant la confidentialité pour les salles blanches
Associez et faites correspondre les dossiers clients, utilisez des outils d’analytique flexibles et formez et déployez des modèles de ML avec vos partenaires
Sujets de la page
Multipartite
Ouvrir toutCollaborer sur vos données où qu’elles se trouvent
Ouvrir toutAccès complet par programmation
Ouvrir toutRôles configurables
Ouvrir toutAWS Entity Resolution sur AWS Clean Rooms
Ouvrir toutPySpark
Ouvrir toutSQL flexible
Ouvrir toutLes règles d’analyse sont des restrictions qui vous permettent de contrôler de manière intégrée la manière dont vos données peuvent être analysées. Les membres de la collaboration qui créent ou rejoignent une collaboration en tant qu'exécuteurs de requêtes désignés peuvent rédiger des requêtes pour croiser et analyser vos tables de données conformément aux règles d'analyse que vous avez définies. AWS Clean Rooms prend en charge trois types de règles d’analyse : agrégation, liste et personnalisée.
Règle d’analyse d'agrégation : la règle d’analyse d’agrégation vous permet d’exécuter des requêtes qui génèrent des statistiques agrégées, comme la taille de l’intersection de deux jeux de données. Lorsque vous utilisez la règle d’analyse d’agrégation, vous pouvez faire en sorte que seules les requêtes d’agrégation puissent être exécutées sur vos données et appliquer des restrictions sur des parties spécifiques des requêtes exécutées, comme les colonnes qui ne doivent être utilisées que lors d’une correspondance aveugle et les colonnes qui peuvent être utilisées dans des agrégations telles que les sommes, les dénombrements ou les moyennes. Vous contrôlez également la contrainte d'agrégation minimale dans la sortie. Vous pouvez également définir des contraintes d'agrégation minimales qui vous permettent de définir des conditions pour les retours de ligne de sortie. Ces contraintes se présentent sous la forme COUNT DISTINCT (Column) >= Threshold. Si une ligne de sortie des résultats de la requête ne répond à aucune des contraintes, elle est supprimée du jeu de résultats. Cela vous permet de vous assurer que des seuils d’agrégation minimum sont automatiquement appliqués tout en offrant de la flexibilité aux collaborateurs qui peuvent écrire les requêtes de leur choix, vous assurant.
Règle d’analyse de liste : la règle d’analyse de liste vous permet d’exécuter des requêtes qui extraient la liste au niveau des lignes de l’intersection de plusieurs jeux de données, comme le chevauchement de deux jeux de données. Lorsque vous utilisez la règle d’analyse de liste, vous pouvez faire en sorte que seules les requêtes de liste puissent être exécutées sur vos données et appliquer des restrictions aux requêtes qui s’exécutent, par exemple quelles colonnes doivent être utilisées uniquement en cas de correspondance aveugle et quelles colonnes peuvent être affichées sous forme de liste dans la sortie.
Règle d’analyse personnalisée : la règle d’analyse personnalisée vous permet de créer des requêtes personnalisées en utilisant la plupart des instructions SQL standard ANSI, telles que les expressions de table communes (CTE) et les fonctions de fenêtre. Vous pouvez également consulter et autoriser les requêtes avant que les partenaires de collaboration ne les exécutent, et examiner les requêtes des autres collaborateurs avant qu'elles ne soient autorisées à être exécutées sur vos tables. Lorsque vous utilisez la règle d'analyse personnalisée, vous pouvez utiliser le contrôle intégré pour déterminer ou limiter, dès le départ, la manière dont vos données sous-jacentes peuvent être analysées, au lieu de devoir vous fier aux journaux de requêtes une fois les analyses terminées. Lorsque vous utilisez des requêtes SQL personnalisées, vous pouvez également créer ou utiliser des modèles d'analyse pour stocker des requêtes personnalisées avec des paramètres dans les collaborations. Cela permet aux clients de s'entraider plus facilement dans le cadre d'une collaboration. Par exemple, un membre ayant une plus grande expérience de SQL peut créer des modèles que d'autres membres pourront examiner et éventuellement exécuter. Cela facilite également les analyses réutilisables dans le cadre de la collaboration. Vous pouvez également utiliser la confidentialité différentielle AWS Clean Rooms en sélectionnant une règle d’analyse personnalisée, puis en configurant vos paramètres de confidentialité différentielle.
Vous pouvez exécuter des requêtes AWS Clean Rooms sur des données protégées par cryptographie. Si vous devez respecter des politiques de traitement de données qui exigent le chiffrement de données sensibles, vous pouvez effectuer un chiffrement préalable des données à l'aide d'une clé de chiffrement partagée spécifique à la collaboration, de sorte que les données soient chiffrées même lorsque les requêtes sont exécutées. La cryptographie informatique garantit que les données utilisées dans les calculs collaboratifs restent cryptées au repos, en transit et en cours d’utilisation (pendant le traitement).
La cryptographie informatique pour les salles blanches (C3R) est un SDK Java open source avec une interface de ligne de commande maintenant disponible sur GitHub. Cette fonctionnalité est disponible sans frais supplémentaires. Si vous disposez de big data, vous pouvez consulter la documentation pour voir comment C3R peut être intégré à Apache Spark.
Cette fonctionnalité est la dernière d’une vaste gamme d’outils de cryptographie informatique AWS conçus pour vous aider à répondre à vos besoins en matière de sécurité et de conformité tout en vous permettant de tirer parti de la flexibilité, de la capacité de mise à l’échelle, des performances et de la facilité d’utilisation proposées par AWS.
ML renforçant la confidentialité
Ouvrir toutAWS Clean Rooms ML vous aide, ainsi que vos partenaires, à appliquer le machine learning (ML) qui améliore la confidentialité pour générer des informations prédictives sans avoir à partager des données brutes entre vous. AWS Clean Rooms ML prend en charge la modélisation de machine learning (ML) personnalisée et similaire. Grâce à la modélisation personnalisée, vous pouvez apporter un modèle personnalisé pour l’entraînement et exécuter des inférences sur des jeux de données collectifs, sans partager les données sous-jacentes ou la propriété intellectuelle entre les collaborateurs. Avec la modélisation similaire, vous pouvez utiliser un modèle créé par AWS pour générer un ensemble étendu de profils similaires sur la base d’un petit échantillon de profils que vos partenaires apportent dans le cadre d’une collaboration.
AWS Clean Rooms ML aide les clients dans de nombreux cas d’utilisation. Par exemple, les annonceurs peuvent intégrer leur modèle et leurs données propriétaires dans une collaboration de salle blanche, et inviter les diffuseurs de publication à intégrer leurs données pour former et déployer un modèle de ML personnalisé qui les aide à améliorer l’efficacité de leurs campagnes ; les institutions financières peuvent utiliser les enregistrements de transactions historiques pour créer un modèle de ML personnalisé et inviter des partenaires à participer à une collaboration Clean Rooms afin de détecter les transactions potentiellement frauduleuses ; les instituts de recherche et les réseaux hospitaliers peuvent trouver des candidats similaires aux participants existants aux essais cliniques afin d’accélérer les études cliniques ; et les marques et les diffuseurs de publication peuvent modéliser des segments similaires de clients sur le marché et proposer des expériences publicitaires très pertinentes, sans qu’aucune des entreprises ne partage ses données sous-jacentes avec l’autre.
À l’aide d’un modèle créé par AWS, AWS Clean Rooms ML a été conçu et testé sur de nombreux jeux de données, tels que le commerce électronique et le streaming vidéo, et peut vous aider à améliorer la précision de modélisation similaire jusqu’à 36 %, par rapport aux données de référence représentatives du secteur. Dans des applications concrètes telles que la prospection de nouveaux clients, cette amélioration de la précision peut résulter sur des économies de plusieurs millions de dollars.
AWS Clean Rooms vous permet, à vous et à vos partenaires, de générer des jeux de données synthétiques à partir de vos données collectives pour entraîner des modèles de machine learning (ML) de régression et de classification. AWS Clean Rooms ML applique des contrôles renforçant la confidentialité pour protéger vos données exclusives et vos modèles ML tout en générant des informations prédictives. En tant que contrôle renforçant la confidentialité, la génération de jeux de données synthétiques vous permet, à vous et à vos partenaires, de créer des jeux de données d’entraînement dotés de propriétés statistiques similaires à celles d’origine, ouvrant ainsi la voie à de nouveaux cas d’utilisation d’entraînement des modèles ML pour des jeux de données collectifs qui étaient auparavant restreints pour des raisons de confidentialité des données.
La génération de jeux de données synthétiques améliorant la confidentialité pour le machine learning personnalisé dans AWS Clean Rooms ML fonctionne en anonymisant les sujets, tels que les personnes ou les entités au sujet desquelles des données ont été collectées, dans les données d’origine, atténuant ainsi le risque qu’un modèle mémorise des informations concernant des individus dans le jeu de données. Le processus de génération de jeux de données synthétiques est optimisé pour créer des jeux de données compatibles avec les algorithmes de régression et de classification de votre choix.