亚马逊AWS官方博客
Category: Analytics
使用机架感知功能降低 Amazon MSK 流量成本
本文主要介绍 Amazon MSK 流量成本优化的最佳实践,通过 KIP-392 实现 consumer 对 MSK Broker 在同可用区内消息就近读取,可以降低跨可用区数据传输成本、提升 consumer 的消费效率。
物流数据湖构建与分析中台转型案例分析
在现代物流行业中,数据的有效管理与分析对于提升业务效率和决策能力至关重要。其中,WMS(仓库管理系统)是实现高 […]
使用 AWS Distro for OpenTelemetry 和 OpenSearch 构建一体化可观测性平台
现代应用和基础设施管理复杂,传统监控工具难以提供充分的可见性。本文介绍如何使用 AWS Distro for OpenTelemetry 和 OpenSearch 构建一体化可观测性平台,提升系统健康和效率。
基于 IoT 数据平台案例看 EMR HBase GC 优化
在当今数字化时代,物联网(IoT)设备的普及使得数据的产生与处理变得愈加复杂。我们正在运营一个全球服务的 IoT 数据平台,面临着众多挑战。在这个平台上,数百万设备持续不断地上报数据,写入并发量高达 12,000 次每秒。为了满足实时读取的需求,我们希望保持与本地 HDFS 性能一致,同时分时任务能够异步返回。
基于 TLS 1.2 TLS 1.3 的 SAML ADFS 实现控制台及 Redshift 用户的安全单点登录(三)
客户端 前面两章分别完成了 Windows 服务器以及亚马逊云平台的安装配置,本章我们将在另一台 EC2 实例 […]
基于 TLS 1.2 TLS 1.3 的 SAML ADFS 实现控制台及 Redshift 用户的安全单点登录(二)
亚马逊云控制台配置 上一章我们已经配置了 AD 域及 ADFS 服务,在域中添加了用户 bob 并将他设置为组 […]
基于 TLS 1.2 TLS 1.3 的 SAML ADFS 实现控制台及 Redshift 用户的安全单点登录(一)
背景介绍 很多企业都希望借助 Windows Active Directory Federation Serv […]
引入作业队列,扩展您的 Amazon Glue 工作负载
数据是业务的关键驱动力。随着时间的推移,数据量可能会显著增加,而这些数据通常需要同时消耗大量计算资源。随着越来 […]
基于开源工具构建 EMR 数据分析平台(二)使用 Dinky 进行 Flink 任务开发、管理
本文介绍了 Dinky 作为一个开源的实时计算平台,如何与 Amazon EMR Flink 集成部署,为数据分析平台提供易用且强大的实时在线任务处理能力。Dinky 凭借其先进的架构设计、完备的功能模块和便捷的开发运维体验,能够很好地弥补 Amazon EMR 在任务提交、管理、监控等方面的复杂度,使得构建实时数据分析平台的整个过程更加顺畅高效。
基于开源工具构建 EMR 数据分析平台(一)方案总体介绍
本文提出了一种结合开源组件与 AWS 服务的综合性解决方案,旨在利用 Amazon 的高性能计算资源,为客户提供一个易于使用、开源可控、低成本、且功能完备的数据平台。该方案涵盖了调度平台、Flink 作业平台、Spark SQL 执行网关、SQL 开发平台和元数据管理平台等多个关键组件,并通过实际案例展示了其在生产环境中的成功应用。