Spark Hudi | 亚马逊AWS官方博客

Tag: Spark Hudi

从 Kudu 迁移到 Hudi

在构建本地数据中心的时候，出于Kudu良好的性能和兼备OLTP和OLAP的特性，以及对Impala SQL和Spark的支持，很多用户会选择Impala/Spark + Kudu的技术栈。但是由于Kudu对本地存储的依赖，导致无法支持的数据高可用和弹性扩缩容，以及社区的逐渐不活跃，越来越多的用户，开始迁移到云上的Trino/Spark + Hudi 技术栈，本文通过一个实际的例子，来看一下迁移过程中发生的代码的重构和数据的迁移。

亚马逊AWS官方博客

Tag: Spark Hudi

从 Kudu 迁移到 Hudi

了解

资源

开发人员

帮助