- Analisi dei dati›
- AWS Clean Rooms›
- Caratteristiche
Caratteristiche di AWS Clean Rooms
Crea camere bianche in pochi minuti. Collabora con i tuoi partner senza condividere dati grezzi
Perché scegliere AWS Clean Rooms?
Crea la tua camera bianca, aggiungi i partecipanti e inizia a collaborare in pochi passaggi
Collabora con qualsiasi azienda senza condividere o rivelare i dati sottostanti
Proteggi i dati di base con un'ampia gamma di controlli per il potenziamento della privacy per le camere bianche
Collega e abbina i record cliente, utilizza strumenti di analisi flessibili, addestra e implementa modelli di ML con i partner
Argomenti della pagina
Multipartitico
Apri tuttoGestisci i dati nella loro posizione originale
Apri tuttoAccesso programmatico completo
Apri tuttoRuoli configurabili
Apri tuttoAWS Entity Resolution in AWS Clean Rooms
Apri tuttoPySpark
Apri tuttoSQL flessibile
Apri tuttoLe regole di analisi sono restrizioni che offrono un controllo integrato su come possono essere analizzati i dati. I membri della collaborazione che creano o partecipano a una collaborazione in qualità di query runner designati possono scrivere query per intersecare e analizzare le tabelle di dati in base alle regole di analisi impostate. AWS Clean Rooms supporta tre tipi di regole di analisi: aggregazione, elenco e personalizzate.
Regola di analisi dell'aggregazione: la regola di analisi dell'aggregazione consente di eseguire query che generano statistiche aggregate, ad esempio la dimensione dell'intersezione di due set di dati. Quando si utilizza la regola di analisi dell'aggregazione, è possibile imporre che solo le query di aggregazione possano essere eseguite sui dati e applicare restrizioni su parti specifiche delle query eseguite, ad esempio quali colonne devono essere utilizzate solo in una corrispondenza esatta e quali possono essere utilizzate in aggregazioni come somme, conteggi o medie. È inoltre possibile controllare il vincolo minimo di aggregazione nell'output. I vincoli di aggregazione minima permettono di impostare le condizioni per i ritorni delle righe di output. Questi vincoli sono nel formato COUNT DISTINCT (Column) >= Limite. Se una riga di output nei risultati della query non rispetta nessuno dei vincoli, viene rimossa dal set di risultati. Ciò consente di fornire flessibilità ai collaboratori dei dati che possono scrivere query di loro scelta, garantendo al tempo stesso che i limiti minimi di aggregazione vengano applicati automaticamente.
Regola di analisi di elenco: la regola di analisi di elenco consente di eseguire query che estraggono l'elenco a livello di riga dell'intersezione di più set di dati, ad esempio la sovrapposizione di due set di dati. Quando si utilizza la regola di analisi di elenco, è possibile imporre che solo le query di elenco possano essere eseguite sui dati e applicare restrizioni alle query eseguite, ad esempio quali colonne devono essere utilizzate solo in una corrispondenza esatta e quali colonne possono essere visualizzate come elenco nell'output.
Regola di analisi personalizzata: la regola di analisi personalizzata consente di creare query personalizzate utilizzando la maggior parte dell'SQL standard ANSI, come le espressioni di tabella comuni (CTE) e le funzioni delle finestre. È inoltre possibile rivedere e autorizzare le query prima che i collaboratori le eseguano e rivedere le query degli altri collaboratori prima che vengano eseguite sulle proprie tabelle. Quando si utilizza la regola di analisi personalizzata, è possibile utilizzare il controllo integrato per determinare o limitare, in anticipo, il modo in cui i dati sottostanti potrebbero essere analizzati, invece di dover fare affidamento sui log delle query dopo il completamento delle analisi. Quando si utilizzano query SQL personalizzate, è anche possibile creare o utilizzare modelli di analisi per archiviare query personalizzate con parametri nelle collaborazioni. In questo modo i clienti possono collaborare più facilmente tra loro. Ad esempio, un membro con una maggiore esperienza SQL può creare modelli che altri membri possono rivedere e potenzialmente eseguire. Inoltre, facilita le analisi riutilizzabili nella collaborazione. È anche possibile utilizzare la privacy differenziale di AWS Clean Rooms selezionando una regola di analisi personalizzata e configurando i parametri di privacy differenziale.
È possibile eseguire query AWS Clean Rooms su dati protetti da crittografia. Se si dispone di policy di gestione dei dati che richiedono la crittografia dei dati sensibili, è possibile precodificare i dati utilizzando una chiave di crittografia condivisa e specifica per collaborazione, in modo che i dati siano crittografati anche durante l'esecuzione delle query. Il computing crittografico garantisce che i dati utilizzati nei calcoli collaborativi rimangano crittografati a riposo, in transito e in uso (durante l'elaborazione).
Computing crittografico per Clean Rooms (C3R) è un SDK Java open source con una CLI, disponibile in GitHub. Questa funzionalità è disponibile senza alcun costo aggiuntivo. In caso di big data, è possibile consultare la documentazione per scoprire come C3R può essere integrato in Apache Spark.
Questa funzionalità è l'ultima di un'ampia gamma di strumenti di computing crittografico di AWS creati allo scopo di aiutare l'utente a soddisfare le proprie esigenze in termini di sicurezza e conformità, consentendo al contempo di sfruttare la flessibilità, la scalabilità, le prestazioni e la facilità d'uso offerte da AWS.
ML per la tutela della privacy
Apri tuttoAWS Clean Rooms ML consente agli utenti e ai loro partner di applicare tecniche di machine learning (ML) per il miglioramento della privacy per generare informazioni predittive senza dover condividere dati non elaborati tra di loro. AWS Clean Rooms ML supporta la modellazione di machine learning (ML) personalizzata e per somiglianza. Con la modellazione personalizzata, è possibile creare un modello personalizzato per la formazione ed eseguire inferenze su set di dati collettivi, senza condividere i dati sottostanti o la proprietà intellettuale tra i collaboratori. Con la modellazione per somiglianza, è possibile utilizzare un modello creato da AWS per generare un set esteso di profili simili sulla base di un piccolo campione di profili che i partner apportano a una collaborazione.
AWS Clean Rooms ML aiuta i clienti con diversi casi d'uso. Ad esempio, gli inserzionisti possono inserire il modello e i dati proprietari in una collaborazione Clean Rooms e invitare i publisher a unire i propri dati per addestrare e implementare un modello ML personalizzato che li aiuti ad aumentare l'efficacia della campagna; gli istituti finanziari possono utilizzare i record storici delle transazioni per addestrare un modello ML personalizzato e invitare i partner a partecipare a una collaborazione Clean Rooms per individuare transazioni potenzialmente fraudolente; gli istituti di ricerca e le reti ospedaliere possono trovare candidati simili ai partecipanti agli studi clinici esistenti per velocizzare gli studi clinici; infine, marchi e publisher possono modellare segmenti simili di clienti sul mercato e offrire esperienze pubblicitarie altamente pertinenti, senza che nessuna delle due società condivida con l'altra i dati sottostanti.
La modellazione per somiglianza di AWS Clean Rooms ML, che utilizza un modello creato da AWS, è stata creata e testata su svariati set di dati, come e-commerce e streaming video, e aiuta i clienti a migliorare la precisione della modellazione per somiglianza fino al 36% rispetto ai dati di riferimento rappresentativi del settore. Nelle applicazioni reali, come la ricerca di nuovi clienti, questo miglioramento della precisione può tradursi in risparmi di milioni di dollari.
AWS Clean Rooms consente a te e ai tuoi partner di generare set di dati sintetici dai dati collettivi per addestrare modelli di machine learning (ML) di regressione e classificazione. AWS Clean Rooms ML applica controlli che migliorano la privacy per contribuire a salvaguardare i dati proprietari e i modelli ML generando informazioni predittive. Come controllo che migliora la privacy, la generazione di set di dati sintetici consente a te e ai tuoi partner di creare set di dati di addestramento con proprietà statistiche simili a quelle originali, sbloccando nuovi casi d'uso di addestramento dei modelli ML per set di dati collettivi che in precedenza erano limitati da problemi di privacy dei dati.
La generazione di set di dati sintetici che migliorano la privacy per il machine learning personalizzato in AWS Clean Rooms ML funziona de-identificando i soggetti, come persone o entità su cui sono stati raccolti i dati, nei dati originali, mitigando il rischio che un modello memorizzi informazioni sulle persone nel set di dati. Il processo di generazione di set di dati sintetici è ottimizzato per creare set di dati compatibili con algoritmi di regressione e classificazione di tua scelta.