이제 IDC 기반 도메인용 Amazon SageMaker Unified Studio에서 Apache Spark 계보 사용 가능

게시된 날짜: 2026년 2월 4일

Amazon SageMaker는 IDC 기반 도메인용 SageMaker Unified Studio의 Amazon EMR 및 AWS Glue에서 실행되는 Apache Spark 작업의 데이터 리니지 기능을 정식 출시한다고 발표했습니다. 데이터 리니지는 복잡한 문제의 근본 원인을 식별하고 변경의 영향을 이해하는 데 필요한 정보를 제공합니다.

이 기능은 EMR-EC2, EMR-서버리스, EMR-EKS, AWS Glue에서의 Spark 실행에서 데이터 자산 및 열의 스키마 계보 캡처와 변환을 지원합니다. 그런 다음 SageMaker Unified Studio에서 그래프로 이 계보를 시각적으로 탐색하거나 API를 사용하여 쿼리할 수 있습니다. 계보를 사용하여 Spark 작업의 기록 전반에서 변환을 비교할 수도 있습니다.

Spark 계보는 기존의 모든 SageMaker Unified Studio 리전에서 사용할 수 있습니다. 이 새로운 기능을 활용해 계보 사용을 시작하는 방법에 대한 자세한 내용은 설명서를 참조하세요.