Garis keturunan Apache Spark sekarang tersedia di Studio Terpadu Amazon SageMaker untuk domain berbasis IDC

Dikirim di: 4 Feb 2026

Amazon SageMaker mengumumkan ketersediaan umum Silsilah Data untuk pekerjaan Apache Spark yang dieksekusi di Amazon EMR dan AWS Glue di SageMaker Unified Studio untuk domain berbasis IDC. Silsilah Data memberi Anda informasi yang Anda butuhkan untuk mengidentifikasi akar penyebab masalah kompleks dan memahami dampak perubahan.

Fitur ini mendukung penangkapan garis keturunan skema dan transformasi aset data dan kolom dari eksekusi Spark di EMR-EC2, EMR-Nirserver, EMR-EKS, dan AWS Glue. Anda kemudian dapat menjelajahi silsilah ini secara visual sebagai grafik di SageMaker Unified Studio atau menanyainya menggunakan API. Anda juga dapat menggunakan silsilah untuk membandingkan transformasi di seluruh riwayat pekerjaan Spark.

Garis keturunan Spark tersedia di semua region SageMaker Unified Studio yang ada. Untuk informasi lebih rinci tentang cara memulai garis keturunan menggunakan fitur-fitur baru ini, lihat dokumentasi.