亚马逊AWS官方博客

AWS Team

Author: AWS Team

使用 EMR Hue 整合 Apache Kyuubi 提升 Spark SQL 开发效率

Amazon EMR 是一种全托管的云端数据平台,用于处理和分析大数据集。它基于开源的 Apache Hadoop 和 Apache Spark 等大数据技术栈,提供了一系列易于使用的工具,可帮助用户在云端快速构建和管理大规模的数据处理和分析应用程序。本文通过介绍在 EMR 中安装、集成 Apache Kyuubi,帮助提升在 EMR 平台上使用 Hue 进行 Spark SQL 开发的效率。

多条 DX 专线上的流量工程与高可用方案设计 – Part 2

随着业务的扩展,企业客户在使用已有专线的基础上,需要增加专线来满足需求,实现多专线组网流量优化。同时,为了避免单线故障,提升业务容灾能力,灵活使用边界网关协议(BGP:Border Gateway Protocol)和 AWS 提供的各类网络服务来实现业务在新老专线的负载均衡或主备冗余。

使用 Amazon EMR Studio 探索 Apache Hudi 核心概念 (2) – File Sizing

本系列文章使用 Amazon EMR Notebook 对 Apache Hudi 核心概念展开深入的探索和介绍,利用 Notebook 提供的统一环境和上下文,我们可以非常生动地观察到 Hudi 的运行机制,并深刻体会到其背后的控制原理,这也正是本系列文章的写作灵感:我们希望借助 Notebook“探索,发现,思考,领悟”的思维模式,带领大家开启一段 Hudi 核心概念的探索之旅。