PySpark có sẵn trong AWS Clean Rooms
Hôm nay, AWS công bố áp dụng rộng rãi PySpark trong AWS Clean Rooms để cho phép các công ty và đối tác của công ty chạy những phân tích tinh vi trên tập dữ liệu lớn bằng cách sử dụng PySpark, API Python dành cho Apache Spark. Với lần ra mắt này, bạn và đối tác của mình có thể đưa mã và thư viện PySpark vào phiên cộng tác trong AWS Clean Rooms và chạy phân tích nâng cao mà không cần phải chia sẻ dữ liệu cơ sở hoặc phương pháp phân tích độc quyền. Ví dụ: nhà cung cấp dịch vụ đo lường quảng cáo có thể sử dụng PySpark trong AWS Clean Rooms để chạy thuật toán tùy chỉnh trên nhiều tập dữ liệu của nhà xuất bản cùng lúc nhằm đo lường hiệu quả quảng cáo. Tương tự, một công ty dược phẩm có thể chạy các thuật toán và thư viện độc quyền của mình trên nhiều tập dữ liệu của nhà cung cấp dịch vụ chăm sóc sức khỏe (nếu được bệnh nhân đồng ý) để đánh giá mức độ tuân thủ thuốc trong các thử nghiệm lâm sàng mà không cần chia sẻ dữ liệu độc quyền của họ.
AWS Clean Rooms giúp các công ty và đối tác của công ty dễ dàng phân tích cũng như cộng tác trên tập dữ liệu tổng hợp của họ mà không cần tiết lộ hay sao chép dữ liệu cơ bản của nhau. Các công ty có thể triển khai môi trường bảo mật của mình mà không cần phải xây dựng, quản lý hoặc duy trì giải pháp riêng hay di chuyển dữ liệu ra khỏi môi trường AWS. PySpark trong AWS Clean Rooms được cung cấp rộng rãi ở các Khu vực AWS này. Để tìm hiểu thêm, hãy truy cập AWS Clean Rooms.