亚马逊AWS官方博客
Category: Analytics
预处理日志以便在 Amazon ES 中进行异常检测
Amazon Elasticsearch Service(Amazon ES)支持实时的异常检测,它使用机器学习(ML)主动检测实时流数据中的异常情况。当分析应用程序日志时,它可以用来检测例如异常高的错误率或请求数量的突然变化等异常状况。例如,来自特定地区的食品配送订单数量的突增可能是由于天气变化或该地区用户遇到技术故障造成的。发现这种异常情况可以促进对事件的快速调查和补救。
使用 Simple Replay 实用程序简化 Amazon Redshift RA3 迁移评估
Amazon Redshift 是快速、广受欢迎的完全托管式云数据仓库,允许您使用标准 SQL 处理数据仓库、运营数据库和数据湖中的 EB 级数据。它提供不同的节点类型以适应各种工作负载;您可以根据需求从 RA3、DC2 和 DS2 中选择。RA3 是最新的实例类型,它允许您独立扩展计算和存储并支付其费用,还支持跨集群数据共享和跨可用区集群重新定位等高级功能。有关升级时节点计数和类型建议的更多信息,请参阅升级到 RA3 节点类型。
如何在亚马逊云科技数据湖内删除用户数据
在本文中,我们将介绍一套框架,帮忙清除您组织中的亚马逊云科技托管数据湖内的各特定用户数据。此外,我们还将共同了解一套由多种不同亚马逊云科技存储层构成的分析解决方案,以及针对Amazon S3的示例代码。
Amazon Redshift十大性能调优技巧综述
在 Amazon Redshift 的协助下,客户得以顺利完成一系列业务目标,例如从加速现有数据库环境,到提取网络日志以进行大数据分析等等。
Amazon EMR在FreeWheel的应用与实践
FreeWheel大数据团队在搭建数据仓库的过程中,在EMR的使用上积累了大量的实践和运维经验,本文将从EMR实践的角度出发,讲述FreeWheel Transformer团队在搭建ETL pipeline的过程中是如何玩转EMR的,以期抛砖引玉。
在Amazon Kinesis Data Analytics中通过PyFlink实现Python流数据处理和分析
本文首先介绍了在亚马逊云科技平台上使用Apache Flink的快速方式 – Amazon Kinesis Data Analytics for Flink,然后通过一个无服务器架构的示例演示了如何在Amazon Kinesis Data Analytics for Flink通过PyFlink实现Python流数据处理和分析,并通过Glue和Athena对数据进行即席查询。
大道至简-使用Athena对数据ETL处理
This article introduces the use of Athena to crop, enrich, repartition, format conversion and other ETL operations
使用SQL Server原生备份与还原功能,将本地SQL Server数据库迁移至Amazon RDS on VMware
Amazon RDS on VMware支持在本地VMware环境下为用户提供托管SQL Server数据库服务。SQL Server的管理工作向来以复杂与耗时著称,但RDS on VMware足可以帮助大家在VMware vSphere集群上轻松的配置、扩展并运营SQL Server。您可以将原有的本地SQL Sever数据库迁移至RDS on VMware上,借此发挥托管服务的固有优势。
在Amazon RDS for MySQL数据库上提升MySQL只读副本的最佳实践
在本文中,我们将了解如何通过上述方法在Amazon RDS for MySQL数据库上执行主版本升级,以及与之相关的最佳实践。此外,我们还将探讨可供选择的其他操作步骤。
数据分析的技术源流
对于数据仓库、大数据、数据湖等技术源流的回顾与思考,厘清技术发展的脉络