亚马逊AWS官方博客

Tag: Data lineage

本文会带您一步一步地在AWS上部署Spline,提供在Glue和EMR中实现Spark代码级别的血缘，并且结合开源数据湖架构Hudi和Delta Lake来提供批流入湖实例，本文会重点介绍如何使用Spline来捕获。

Atlas 是一套可伸缩且可扩展的数据治理服务，使企业能够有效和高效地满足其在 Hadoop 生态中的合规要求，并允许与整个企业数据生态系统集成。