AWS Clean Rooms에서 PySpark 사용 가능

게시된 날짜: 2025년 3월 18일

오늘 AWS는 AWS Clean Rooms에서 PySpark를 정식 버전으로 제공한다고 발표했으며, 이를 통해 기업과 파트너가 Apache Spark용 Python API, PySpark를 사용하여 대규모 데이터세트에서 정교한 분석을 실행할 수 있게 되었습니다. 이번 출시를 통해 파트너와 함께 기본 데이터나 독점 분석 방법을 공유할 필요 없이 PySpark 코드 및 라이브러리를 AWS Clean Rooms 협업에 가져와 고급 분석을 실행할 수 있습니다. 그 예로 광고 측정 제공업체는 AWS Clean Rooms의 PySpark를 사용하여 여러 게시자 데이터세트에서 사용자 지정 알고리즘을 동시에 실행하여 광고 효과를 측정할 수 있습니다. 마찬가지로 제약 회사는 적합한 환자 동의를 얻어 여러 의료 서비스 제공업체 데이터세트에서 독점 알고리즘과 라이브러리를 실행하여 독점 데이터를 공유하지 않고도 임상 시험 전반에서 약물 순응도를 평가할 수 있습니다.

AWS Clean Rooms는 기업과 파트너가 상대방의 기본 데이터를 공개하거나 복사하지 않고도 공동 데이터세트를 쉽게 분석 및 협업할 수 있도록 지원합니다. 기업은 자체 솔루션을 구축, 관리 또는 유지 관리하거나 데이터를 AWS 환경 외부로 이동할 필요도 없이 자체 클린 룸을 배포할 수 있습니다. AWS Clean Rooms의 PySpark는 다음 AWS 리전에서 정식 버전으로 제공됩니다. 자세한 내용은 AWS Clean Rooms로 이동하세요.