亚马逊AWS官方博客
Category: Analytics
利用 Lambda 将 Kinesis Data Stream 数据批量自动写入 MSK
本文介绍了一种利用亚马逊云科技 Lambda 自动将 Kinesis Data Stream 中的数据导入到 Kafka 的方案。所有的应用无需修改,便能平滑迁移到亚马逊云科技上,同时运维人力成本也基本不会增加。
解密数据编织的核心技术 – 数据虚拟化
数据编织与传统数据平台的核心差异就在于数据虚拟化(Data Virtualization)。几乎无需搬移或复制物理数据,即可通过逻辑层快速实现元数据的实时连接、整合、消费,赋能数据服务。本文详细剖析了数据虚拟化,并带您快速了解亚马逊云科技及合作伙伴 Denodo 领先的联合数据解决方案。
基于 Redshift 和 Grafana 搭建实时大屏应用
本文从大屏应用涉及的技术要点入手,详细论述了如何在亚马逊云科技上基于 Kinesis 和 Redshift stream ingestion 以及 Amazon 托管的 Grafana 来实现实时大屏,满足运维实时监控,物联网,APP 埋点实时分析,黑五、双 11、 618 等电商平台的实时数据可视化展示等场景。
使用 Kafka Connect 简化数据采集管道
Kafka Connect 是一种在 Apache Kafka 和其他数据系统之间实现可靠地流式传输数据的工具。本文介绍了使用 Kafka Connect/亚马逊云科技 MSK Connect 通过简单配置构建数据流管道的架构设计,并对典型场景服务器日志采集入湖 S3 进行了示例讲解。
AWS 部署无服务器 DolphinScheduler
本文提供了在亚马逊云科技使用完全无服务器的 AWS EKS on Fargate 容器服务及 Amazon Aurora Serverless PostgreSQL 数据库进行部署的方案,并给出了详细的部署步骤及维护指南。
使用 Amazon MSK Serverless 拆分整体式 Apache Kafka 集群
如今,许多公司都在从中小型集中式 Apache Kafka 集群开始着手构建全球流式传输服务,随着时间的推移,他们会选择保留一个整体式集群。本文说明了集中式方法面临的一些挑战,并介绍了使用亚马逊云科技 Amazon MSK Serverless 实施去中心化方法的两种策略。
使用 AWS Glue DataBrew 和 Amazon QuickSight 简化半结构化嵌套 JSON 数据分析
本文演示了如何配置亚马逊云科技 Glue DataBrew 以处理嵌套的 JSON 对象,以及如何使用 Amazon QuickSight 进行数据可视化。
使用 AWS Glue 蓝图将数据库中的数据大规模登陆到数据湖
在本文中,您将通过维护一个包含表名和几个参数的 JSON 文件,学习如何以标准化方式处理数据湖登陆作业部署。您可以进一步自定义亚马逊云科技 Glue 蓝图,创建自己的多步骤数据管道,将数据移动到下游层和专用的分析服务。
AWS Data Lab 如何帮助 BMW Financial Services 设计和构建多账户的现代化数据架构
BMW Group 和亚马逊云科技于 2020 年宣布达成全面战略合作。本文讨论了亚马逊云科技 Data Lab 如何使用云数据中心,帮助 BMW Financial Services 为欧洲 BMW 市场之一构建监管报告应用程序。
使用 AWS CloudFormation 和 AWS CLI 自动管理 Amazon Redshift Serverless 数据仓库
在本文中,我们将讨论如何使用亚马逊云科技 CloudFormation 和亚马逊云科技 CLI 自动管理 Redshift Serverless 数据仓库所涉及的各种任务。