AWS Clean Rooms에서 PySpark 사용 가능
오늘 AWS는 AWS Clean Rooms에서 PySpark를 정식 버전으로 제공한다고 발표했으며, 이를 통해 기업과 파트너가 Apache Spark용 Python API, PySpark를 사용하여 대규모 데이터세트에서 정교한 분석을 실행할 수 있게 되었습니다. 이번 출시를 통해 파트너와 함께 기본 데이터나 독점 분석 방법을 공유할 필요 없이 PySpark 코드 및 라이브러리를 AWS Clean Rooms 협업에 가져와 고급 분석을 실행할 수 있습니다. 그 예로 광고 측정 제공업체는 AWS Clean Rooms의 PySpark를 사용하여 여러 게시자 데이터세트에서 사용자 지정 알고리즘을 동시에 실행하여 광고 효과를 측정할 수 있습니다. 마찬가지로 제약 회사는 적합한 환자 동의를 얻어 여러 의료 서비스 제공업체 데이터세트에서 독점 알고리즘과 라이브러리를 실행하여 독점 데이터를 공유하지 않고도 임상 시험 전반에서 약물 순응도를 평가할 수 있습니다.
AWS Clean Rooms는 기업과 파트너가 상대방의 기본 데이터를 공개하거나 복사하지 않고도 공동 데이터세트를 쉽게 분석 및 협업할 수 있도록 지원합니다. 기업은 자체 솔루션을 구축, 관리 또는 유지 관리하거나 데이터를 AWS 환경 외부로 이동할 필요도 없이 자체 클린 룸을 배포할 수 있습니다. AWS Clean Rooms의 PySpark는 다음 AWS 리전에서 정식 버전으로 제공됩니다. 자세한 내용은 AWS Clean Rooms로 이동하세요.