- Análises›
- AWS Clean Rooms›
- Atributos
Recursos do AWS Clean Rooms
Crie salas limpas em minutos. Colabore com os parceiros sem compartilhar dados brutos
Por que usar o AWS Clean Rooms?
Crie sua própria sala limpa, adicione participantes e inicie a colaboração com apenas algumas etapas
Colabore com qualquer empresa sem compartilhar ou revelar dados subjacentes
Proteja os dados subjacentes com um conjunto abrangente de controles de aprimoramento da privacidade para salas limpas
Vincule e combine registros de clientes, use ferramentas flexíveis de análise e treine e implante modelos de ML com seus parceiros
Tópicos da página
Várias partes
Abrir tudoColaborar com dados onde eles estiverem
Abrir tudoAcesso programático completo
Abrir tudoFunções configuráveis
Abrir tudoAWS Entity Resolution no AWS Clean Rooms
Abrir tudoPySpark
Abrir tudoSQL flexível
Abrir tudoAs regras de análise são restrições que fornecem controle integrado de como seus dados podem ser analisados. Os membros da colaboração que criam ou ingressam em uma colaboração como executores de consulta designados podem gravar consultas para cruzar e analisar suas tabelas de dados de acordo com as regras de análise definidas por você. O AWS Clean Rooms oferece suporte a três tipos de regras de análise: agregação, listas e personalizada.
Regra de análise de agregação: a regra de análise de agregação permite executar consultas que geram estatísticas agregadas, como a definição do tamanho da interseção de dois conjuntos de dados. Ao usar a regra de análise de agregação, é possível impor que somente consultas de agregação possam ser executadas em seus dados e impor restrições em partes específicas das consultas executadas, como quais colunas devem ser usadas somente em uma correspondência oculta e quais colunas podem ser usadas em agregações como somas, contagens ou médias. Você também controla a restrição mínima de agregação na saída. Restrições mínimas de agregação permitem que você defina condições para retornos de linhas de saída. Essas restrições estão no formato de CONTAGEM DISTINTA (Coluna) >= Limite. Se uma linha de saída nos resultados da consulta não atender a nenhuma das restrições, ela será removida do conjunto de resultados. Isso ajuda você a garantir que os limites mínimos de agregação sejam aplicados automaticamente, ao mesmo tempo em que oferece flexibilidade aos colaboradores de dados que podem escrever consultas de sua preferência.
Regra de análise de listas: a regra de análise de listas permite executar consultas que extraem a lista em nível de linha da interseção de vários conjuntos de dados, como a sobreposição de dois conjuntos de dados. Ao usar a regra de análise de listas, é possível impor que somente consultas de listas possam ser executadas em seus dados e impor restrições para as consultas executadas, como quais colunas devem ser usadas somente em uma correspondência oculta e quais colunas podem ser geradas como uma lista na saída.
Regra de análise personalizada: a regra de análise personalizada permite criar consultas personalizadas usando a maior parte do SQL padrão ANSI, como expressões de tabela comuns (CTE) e funções de janela. Você também pode revisar e permitir consultas antes que os parceiros de colaboração as executem e revisar as consultas de outros colaboradores antes que elas possam ser executadas em suas tabelas. Ao usar a regra de análise personalizada, você pode usar o controle integrado para determinar ou limitar, antecipadamente, como seus dados subjacentes podem ser analisados, em vez de depender dos logs de consulta após a conclusão das análises. Ao usar consultas SQL personalizadas, você também pode criar ou usar modelos de análise para armazenar consultas personalizadas com parâmetros nas colaborações. Isso permite que os clientes se ajudem mais facilmente em uma colaboração. Por exemplo, um membro com maior experiência em SQL pode criar modelos para outros membros analisarem e potencialmente executarem. Também facilita análises reutilizáveis na colaboração. Você também pode usar a Privacidade Diferencial do AWS Clean Rooms selecionando uma regra de análise personalizada e, em seguida, configurando seus parâmetros diferenciais de privacidade.
Você pode executar consultas do AWS Clean Rooms em dados protegidos por criptografia. Se você tiver políticas de tratamento de dados que exijam a criptografia dos dados confidenciais, poderá pré-criptografar os dados usando uma chave de criptografia compartilhada específica para colaboração para que os dados fiquem criptografados mesmo enquanto as consultas estiverem sendo executadas. A computação criptográfica garante que os dados usados em computações colaborativas permaneçam criptografados: em repouso, em trânsito e em uso (enquanto estão sendo processados).
Computação criptográfica para salas limpas (C3R) é um Java SDK de código aberto com uma CLI disponível no GitHub. Esse atributo é disponibilizado sem custo adicional. Caso tenha big data, você pode consultar a documentação para ver como o C3R pode ser integrado ao Apache Spark.
Esse atributo é o mais recente de uma ampla gama de ferramentas de computação criptográfica da AWS criadas para ajudar você a atender às suas necessidades de segurança e conformidade, permitindo aproveitar a flexibilidade, a escalabilidade, a performance e a facilidade de uso oferecidas pela AWS.
ML que aprimora a privacidade
Abrir tudoO AWS Clean Rooms ML ajuda você e seus parceiros a aplicar machine learning (ML) de reforço à privacidade, a fim de gerar informações preditivas sem exigir o compartilhamento mútuo de dados brutos. O AWS Clean Rooms ML oferece suporte à modelagem personalizada e semelhante de machine learning (ML). Com a modelagem personalizada, é possível trazer um modelo personalizado para treinamento e executar inferências em conjuntos de dados coletivos, sem fazer o compartilhamento de dados subjacentes ou propriedade intelectual entre colaboradores. Com a modelagem semelhante, é possível usar um modelo criado pela AWS para gerar um conjunto expandido de perfis semelhantes de acordo com uma pequena amostra de perfis trazidos por seus parceiros em uma colaboração.
O AWS Clean Rooms ML ajuda clientes com vários casos de uso. Por exemplo, os anunciantes podem incluir seus modelos e dados privados na colaboração em uma sala limpa e convidar publicadores a agregar seus dados para treinar e implantar um modelo de ML personalizado que os ajude a aumentar a eficácia da campanha; instituições financeiras podem usar registros históricos de transações para treinar um modelo personalizado de ML e convidar parceiros para a colaboração em uma sala limpa a fim de detectar transações potencialmente fraudulentas; instituições de pesquisa e redes hospitalares podem encontrar candidatos semelhantes aos participantes de ensaios clínicos existentes para ajudar a acelerar os estudos clínicos; e marcas e publicadores podem modelar segmentos semelhantes de clientes no mercado e oferecer experiências publicitárias altamente relevantes, sem que nenhuma das empresas compartilhe os dados subjacentes com a outra.
A modelagem semelhante do AWS Clean Rooms ML, que utiliza a criação de modelo AWS, foi criada e testada em uma ampla variedade de conjuntos de dados, como comércio eletrônico e streaming de vídeo, e ela pode ser útil para que os clientes melhorem a precisão de modelagem semelhante em até 36% em comparação com referências representativas do setor. Em aplicações do mundo real, como a prospecção de novos clientes, essa melhoria na precisão pode se traduzir em uma economia de milhões de dólares.
O AWS Clean Rooms permite que você e seus parceiros gerem conjuntos de dados sintéticos a partir de seus dados coletivos para treinar modelos de machine learning (ML) de regressão e classificação. O AWS Clean Rooms ML aplica controles de aprimoramento de privacidade para ajudar a proteger seus dados proprietários e modelos de ML, ao mesmo tempo em que gera insights preditivos. Como um controle que melhora a privacidade, a geração de conjuntos de dados sintéticos permite que você e seus parceiros criem conjuntos de dados de treinamento com propriedades estatísticas semelhantes às originais, desbloqueando novos casos de uso de treinamento de modelos de ML para conjuntos de dados coletivos que antes eram restritos por questões de privacidade de dados.
A geração de conjuntos de dados sintéticos que aprimora a privacidade para machine learning no AWS Clean Rooms ML funciona ao desidentificar sujeitos — como pessoas ou entidades sobre as quais os dados foram coletados — nos dados originais, reduzindo o risco de um modelo memorizar informações sobre indivíduos no conjunto de dados. O processo de geração de conjuntos de dados sintéticos é otimizado para criar conjuntos de dados compatíveis com algoritmos de regressão e classificação de sua escolha.