亚马逊AWS官方博客

Category: Analytics

基于 IoT 数据平台案例看 EMR HBase GC 优化

在当今数字化时代,物联网(IoT)设备的普及使得数据的产生与处理变得愈加复杂。我们正在运营一个全球服务的 IoT 数据平台,面临着众多挑战。在这个平台上,数百万设备持续不断地上报数据,写入并发量高达 12,000 次每秒。为了满足实时读取的需求,我们希望保持与本地 HDFS 性能一致,同时分时任务能够异步返回。

基于开源工具构建 EMR 数据分析平台(二)使用 Dinky 进行 Flink 任务开发、管理

本文介绍了 Dinky 作为一个开源的实时计算平台,如何与 Amazon EMR Flink 集成部署,为数据分析平台提供易用且强大的实时在线任务处理能力。Dinky 凭借其先进的架构设计、完备的功能模块和便捷的开发运维体验,能够很好地弥补 Amazon EMR 在任务提交、管理、监控等方面的复杂度,使得构建实时数据分析平台的整个过程更加顺畅高效。

基于开源工具构建 EMR 数据分析平台(一)方案总体介绍

本文提出了一种结合开源组件与 AWS 服务的综合性解决方案,旨在利用 Amazon 的高性能计算资源,为客户提供一个易于使用、开源可控、低成本、且功能完备的数据平台。该方案涵盖了调度平台、Flink 作业平台、Spark SQL 执行网关、SQL 开发平台和元数据管理平台等多个关键组件,并通过实际案例展示了其在生产环境中的成功应用。