亚马逊AWS官方博客
Category: Analytics
基于 IoT 数据平台案例看 EMR HBase GC 优化
在当今数字化时代,物联网(IoT)设备的普及使得数据的产生与处理变得愈加复杂。我们正在运营一个全球服务的 IoT 数据平台,面临着众多挑战。在这个平台上,数百万设备持续不断地上报数据,写入并发量高达 12,000 次每秒。为了满足实时读取的需求,我们希望保持与本地 HDFS 性能一致,同时分时任务能够异步返回。
基于 TLS 1.2 TLS 1.3 的 SAML ADFS 实现控制台及 Redshift 用户的安全单点登录(三)
客户端 前面两章分别完成了 Windows 服务器以及亚马逊云平台的安装配置,本章我们将在另一台 EC2 实例 […]
基于 TLS 1.2 TLS 1.3 的 SAML ADFS 实现控制台及 Redshift 用户的安全单点登录(二)
亚马逊云控制台配置 上一章我们已经配置了 AD 域及 ADFS 服务,在域中添加了用户 bob 并将他设置为组 […]
基于 TLS 1.2 TLS 1.3 的 SAML ADFS 实现控制台及 Redshift 用户的安全单点登录(一)
背景介绍 很多企业都希望借助 Windows Active Directory Federation Serv […]
引入作业队列,扩展您的 Amazon Glue 工作负载
数据是业务的关键驱动力。随着时间的推移,数据量可能会显著增加,而这些数据通常需要同时消耗大量计算资源。随着越来 […]
基于开源工具构建 EMR 数据分析平台(二)使用 Dinky 进行 Flink 任务开发、管理
本文介绍了 Dinky 作为一个开源的实时计算平台,如何与 Amazon EMR Flink 集成部署,为数据分析平台提供易用且强大的实时在线任务处理能力。Dinky 凭借其先进的架构设计、完备的功能模块和便捷的开发运维体验,能够很好地弥补 Amazon EMR 在任务提交、管理、监控等方面的复杂度,使得构建实时数据分析平台的整个过程更加顺畅高效。
基于开源工具构建 EMR 数据分析平台(一)方案总体介绍
本文提出了一种结合开源组件与 AWS 服务的综合性解决方案,旨在利用 Amazon 的高性能计算资源,为客户提供一个易于使用、开源可控、低成本、且功能完备的数据平台。该方案涵盖了调度平台、Flink 作业平台、Spark SQL 执行网关、SQL 开发平台和元数据管理平台等多个关键组件,并通过实际案例展示了其在生产环境中的成功应用。
基于亚马逊云科技托管 Flink 的开发系列 — SSL 认证的 Kafka 读取篇
1. 概述 上文讲述了如何建立在 Apache Flink 中将数据写入到 Amazon S3。这篇文章将继续 […]
Serverless 架构下的高并发分析查询最佳实践与解决方案
本文主要介绍了在基于亚马逊云科技的一系列 Serverless 托管服务下快速构建的最佳实践和多套解决方案,可以满足不同业务场景下的高并发、低延迟的分析查询需求,同时易于运维与构建。
利用 Amazon FinSpace 构建 Quant Data Analytics 应用
本文围绕 kdb+以及 Amazon 托管的 kdb+ insights 服务,即 Amazon FinSpace,展开对 kdb+,尤其是 Amazon FinSpace 的架构以及功能介绍,并详细描述了如何利用 Amazon FinSpace 构建一个 Quant Data Analytics 应用的操作过程。