亚马逊AWS官方博客
Category: Analytics
Novo Nordisk 如何在 AWS 上构建现代数据架构
介绍了丹麦制药公司 Novo Nordisk 如何在 AWS 上搭建现代数据架构,以支持其医药研发和生产业务。
BMW Cloud Data Hub:现代数据架构在 AWS 上的参考实现
介绍了宝马如何在 AWS 上搭建 Cloud Data Hub,实现数据整合、数据分析和数据可视化等功能。
MSK 可靠性最佳实践
本篇博客介绍了亚马逊云科技 MSK 在生产中的可靠性最佳实践。Kafka 集群、生产者客户端,以及消费者客户端如何进行配置,以达到不同的保障性需求。
基于 AWS S3、EMR Flink、Presto 和 Hudi 的实时数据湖仓 – 使用 EMR 迁移 CDH
该博客介绍了将实时大数据系统从 CDH 迁移到亚马逊云科技 EMR 的项目。
了解 PostgreSQL 中的统计信息
亚马逊云科技提供两种托管 PostgreSQL 选项:适用于 PostgreSQL 的 Amazon Relational Database Service(Amazon RDS)和 Amazon Aurora PostgreSQL 兼容版,本文旨在说明 PostgreSQL 中的统计信息类型以及如何读取和理解它们。
利用 Lambda 将 Kinesis Data Stream 数据批量自动写入 MSK
本文介绍了一种利用亚马逊云科技 Lambda 自动将 Kinesis Data Stream 中的数据导入到 Kafka 的方案。所有的应用无需修改,便能平滑迁移到亚马逊云科技上,同时运维人力成本也基本不会增加。
解密数据编织的核心技术 – 数据虚拟化
数据编织与传统数据平台的核心差异就在于数据虚拟化(Data Virtualization)。几乎无需搬移或复制物理数据,即可通过逻辑层快速实现元数据的实时连接、整合、消费,赋能数据服务。本文详细剖析了数据虚拟化,并带您快速了解亚马逊云科技及合作伙伴 Denodo 领先的联合数据解决方案。
基于 Redshift 和 Grafana 搭建实时大屏应用
本文从大屏应用涉及的技术要点入手,详细论述了如何在亚马逊云科技上基于 Kinesis 和 Redshift stream ingestion 以及 Amazon 托管的 Grafana 来实现实时大屏,满足运维实时监控,物联网,APP 埋点实时分析,黑五、双 11、 618 等电商平台的实时数据可视化展示等场景。
使用 Kafka Connect 简化数据采集管道
Kafka Connect 是一种在 Apache Kafka 和其他数据系统之间实现可靠地流式传输数据的工具。本文介绍了使用 Kafka Connect/亚马逊云科技 MSK Connect 通过简单配置构建数据流管道的架构设计,并对典型场景服务器日志采集入湖 S3 进行了示例讲解。
AWS 部署无服务器 DolphinScheduler
本文提供了在亚马逊云科技使用完全无服务器的 AWS EKS on Fargate 容器服务及 Amazon Aurora Serverless PostgreSQL 数据库进行部署的方案,并给出了详细的部署步骤及维护指南。