亚马逊AWS官方博客
Category: Analytics
Amazon Athena 中调用 Amazon Lambda 实现的 UDF 进行数据解密的效率分析
对企业数据进行在线分析是数据分析的重要手段,借助 Amazon Athena 可以使用标准 SQL 直接查询分析存储于 Amazon S3 中的数据,使分析更加便捷。在 Athena 中,可以通过 Athena 调用用户自定义函数 UDF 对敏感 PII 数据进行加解密。但是其本身并不支持内置的自定义函数,而是将这些功能外置到 Amazon Lambda 中。
Novo Nordisk 如何在 AWS 上构建现代数据架构
介绍了丹麦制药公司 Novo Nordisk 如何在 AWS 上搭建现代数据架构,以支持其医药研发和生产业务。
BMW Cloud Data Hub:现代数据架构在 AWS 上的参考实现
介绍了宝马如何在 AWS 上搭建 Cloud Data Hub,实现数据整合、数据分析和数据可视化等功能。
MSK 可靠性最佳实践
本篇博客介绍了亚马逊云科技 MSK 在生产中的可靠性最佳实践。Kafka 集群、生产者客户端,以及消费者客户端如何进行配置,以达到不同的保障性需求。
基于 AWS S3、EMR Flink、Presto 和 Hudi 的实时数据湖仓 – 使用 EMR 迁移 CDH
该博客介绍了将实时大数据系统从 CDH 迁移到亚马逊云科技 EMR 的项目。
了解 PostgreSQL 中的统计信息
亚马逊云科技提供两种托管 PostgreSQL 选项:适用于 PostgreSQL 的 Amazon Relational Database Service(Amazon RDS)和 Amazon Aurora PostgreSQL 兼容版,本文旨在说明 PostgreSQL 中的统计信息类型以及如何读取和理解它们。
利用 Lambda 将 Kinesis Data Stream 数据批量自动写入 MSK
本文介绍了一种利用亚马逊云科技 Lambda 自动将 Kinesis Data Stream 中的数据导入到 Kafka 的方案。所有的应用无需修改,便能平滑迁移到亚马逊云科技上,同时运维人力成本也基本不会增加。
解密数据编织的核心技术 – 数据虚拟化
数据编织与传统数据平台的核心差异就在于数据虚拟化(Data Virtualization)。几乎无需搬移或复制物理数据,即可通过逻辑层快速实现元数据的实时连接、整合、消费,赋能数据服务。本文详细剖析了数据虚拟化,并带您快速了解亚马逊云科技及合作伙伴 Denodo 领先的联合数据解决方案。
基于 Redshift 和 Grafana 搭建实时大屏应用
本文从大屏应用涉及的技术要点入手,详细论述了如何在亚马逊云科技上基于 Kinesis 和 Redshift stream ingestion 以及 Amazon 托管的 Grafana 来实现实时大屏,满足运维实时监控,物联网,APP 埋点实时分析,黑五、双 11、 618 等电商平台的实时数据可视化展示等场景。
使用 Kafka Connect 简化数据采集管道
Kafka Connect 是一种在 Apache Kafka 和其他数据系统之间实现可靠地流式传输数据的工具。本文介绍了使用 Kafka Connect/亚马逊云科技 MSK Connect 通过简单配置构建数据流管道的架构设计,并对典型场景服务器日志采集入湖 S3 进行了示例讲解。