PySpark está disponible en AWS Clean Rooms

Publicado en: 18 de mar de 2025

Hoy, AWS anuncia la disponibilidad general de PySpark en AWS Clean Rooms, lo que permite a las empresas y a sus socios ejecutar análisis sofisticados en grandes conjuntos de datos mediante PySpark, la API de Python para Apache Spark. Con este lanzamiento, usted y sus socios pueden incorporar el código y las bibliotecas de PySpark a una colaboración de AWS Clean Rooms y ejecutar análisis avanzados sin tener que compartir datos subyacentes o métodos de análisis patentados. Por ejemplo, un proveedor de mediciones publicitarias puede usar PySpark en AWS Clean Rooms para ejecutar sus algoritmos personalizados en varios conjuntos de datos de editores de forma simultánea para medir la eficacia de los anuncios. Del mismo modo, una empresa farmacéutica puede ejecutar sus algoritmos y bibliotecas patentados en varios conjuntos de datos de proveedores de servicios de salud con el consentimiento adecuado de los pacientes para evaluar el cumplimiento del tratamiento con medicamentos en los ensayos clínicos, sin compartir sus datos patentados.

AWS Clean Rooms ayuda a las empresas y a sus socios a realizar análisis y colaborar de manera fácil en los conjuntos de datos colectivos, sin necesidad de revelar ni copiar los datos subyacentes entre sí. Las empresas pueden implementar sus propias salas limpias sin tener que crear, administrar o mantener sus propias soluciones ni mover datos fuera de su entorno de AWS. PySpark en AWS Clean Rooms está disponible con carácter general en estas regiones de AWS. Para obtener más información, visite AWS Clean Rooms.