PySpark está disponível no AWS Clean Rooms

Publicado: 18 de mar de 2025

Hoje, a AWS anuncia a disponibilidade geral do PySpark no AWS Clean Rooms, permitindo que as empresas e seus parceiros executem analytics sofisticados em grandes conjuntos de dados usando o PySpark, a API do Python para o Apache Spark. Com esse lançamento, você e seus parceiros podem levar o código e as bibliotecas do PySpark para colaborar no AWS Clean Rooms e executar análises avançadas sem precisar compartilhar dados subjacentes ou métodos de análise proprietários. Por exemplo, um provedor de medição de publicidade pode usar o PySpark no AWS Clean Rooms para executar seus algoritmos personalizados em vários conjuntos de dados de publicadores ao mesmo tempo para mensurar a eficácia do anúncio. Da mesma forma, uma empresa farmacêutica pode executar seus algoritmos e bibliotecas proprietários em vários conjuntos de dados de provedores de saúde, com o consentimento apropriado dos pacientes, para avaliar a adesão aos medicamentos em ensaios clínicos, sem compartilhar seus dados proprietários.

O AWS Clean Rooms ajuda empresas e seus parceiros a analisar e colaborar com facilidade em conjuntos de dados coletivos, sem revelar ou copiar os dados subjacentes de outras pessoas. As empresas podem implantar suas próprias salas limpas sem precisar criar, gerenciar ou manter suas próprias soluções ou mover dados para fora do ambiente da AWS. O PySpark no AWS Clean Rooms está disponível ao público em geral nestas regiões da AWS. Para saber mais, acesse o AWS Clean Rooms.