亚马逊AWS官方博客
Category: Analytics
使用 Flink Hudi 处理变更数据流并通过 Redshift Spectrum 进行数据分析实践
这是一个典型的数据分析场景,分散在不同业务数据库里的表格数据,需要汇总到数据湖或数据仓库中进行统一分析。运营人员希望尽可能的实时查询到这些数据,他们需要第一手的订单数据以便快速做出决策。 为实现这类场景需求,有很多种办法,本文介绍通过可视化交互开发平台 Zeppelin 上使用 Flink SQL 实现 ETL 任务,并支持近实时高并发 Upsert 到数据湖,利用 Redshift Spectrum 进行快速分析查询。
利用 serverless 服务布署非组织且多账户的 Health 事件监控面板
对于亚马逊云科技的客户及合作伙伴,它们的账户众多且管理权限复杂,同时由于每月就会有数百甚至数千条通告信息,集中查看 Health 事件并定制化展示和分类是具有价值的,这里展示如何利用无服务器服务自动化布署并收集 Health 状态信息,同时定制化适合自己业务需求的监控面板,以此来准确掌控 Health 事件信息。
Amazon DynamoDB Flink SQL 实时计算实践
在实时计算场景下,使用 Flink 结合 HBase 或 Redis 做维表关联计算可以提高计算效率和准确性。例如,在广告投放场景下,可以使用 Flink 结合 HBase 或 Redis 做维表关联计算,从而更加精准地对用户进行定向广告投放和个性化推荐。Amazon DynamoDB 是一种全托管的 NoSQL 数据库服务,提供快速而可预测的性能,能够实现无缝扩展。DynamoDB 可以免除操作和扩展分布式数据库的管理工作负担,因而无需担心硬件预置、设置和配置、复制、软件修补或集群扩展等问题。
使用 DynamoDB 简化 MWAA(Airflow)任务调度开发
MWAA 是一项适用于 Apache Airflow 的托管式编排服务,让您能够在云中大规模设置和操作数据管道。本文介绍了如何使用亚马逊云科技 DynamoDB 简化 MWAA 开发工作,并且提供了 Redshift 调用的实现逻辑参考,提升用户生产效率。
使用 Amazon Glue Data Quality 创建高质量的 ETL 管道
本文介绍如何使用亚马逊云科技 AWS Glue 数据质量来创建高质量的 ETL 管道。
从 AWS Glue 数据目录开始使用 Amazon Glue Data Quality 功能
本文介绍如何从 AWS Glue 数据目录开始使用 AWS Glue 数据质量,以评估和提高数据的质量。
EMR Serverless——通过独立部署 Spark History Server 实现对 Spark Logs 统一管理和使用
此篇文章将介绍通过以独自部署 Spark History Server 的方式,同时企业还可以基于自身实际需求,将 Spark History Server 管理和运营按组织/业务/项目/阶段/Application 进行划分,实现对 Spark Log 统⼀管理和查询。
AWS 全球专家部门使用 Amazon QuickSight 提供全球专家组织(WWSO)的运营洞察
本文介绍 AWS 专家见解团队如何使用 Amazon QuickSight 在 AWS 全球专家组织中提供运营洞察力。
使用 Amazon Redshift 和 Amazon Managed Grafana 构建近实时物流仪表板提升运营智能
本文介绍如何使用 Amazon Redshift 和 Amazon Managed Grafana 构建近实时的物流仪表板来提高运营智能。
网络性能管理公司 NETSCOUT 如何利用 Amazon OpenSearch Service 实现全球 DDoS 感知
介绍了网络性能管理公司 NETSCOUT 如何利用 Amazon OpenSearch Service 实现全球 DDoS 感知,并提高安全性和业务稳定性。