亚马逊AWS官方博客
Category: Analytics
使用 Amazon AppFlow 与 Amazon Athena 分析 Google Analytics 数据
本文向大家介绍了如何使用Amazon AppFlow将Google Analytics数据传输至Amazon S3,并使用Amazon Athena对数据进行分析。利用这套架构,大家无需自主构建专门面向Google Analytics或者其他SaaS应用的数据提取应用程序。Amazon AppFlow使您能够一次性建立起全自动数据传输与转换工作流,以及与之配套的集成查询环境。
通往托管之路:Amazon Elasticsearch Service 用例分析
在加入AWS之前,我曾领导过一支开发团队,负责使用Elasticsearch构建移动广告解决方案。Elasticsearch是一款高人气开源搜索与分析引擎,适用于日志分析、实时应用程序监控、点击流分析以及搜索等多种场景。我负责的这套平台在推动公司业务中,发挥着至关重要的作用。
使用角色链限制 Amazon Redshift IAM 角色和组对 Amazon Redshift Spectrum 外部表访问
本文展示了两种控制用户及组对外部schema及表执行访问的方法。在使用Grant usage语句的第一种方法当中,无论表指向哪一条Amazon S3数据湖路径,被授权的组都可以访问schema中的所有表。这种方法灵活性更强,可以轻松实现访问授权,但无法允许或拒绝访问该schema中的某一或某些特定表。
AWS Glue 版本 2.0 采用快 10 倍的作业启动时间和 1 分钟最低计费持续时间
AWS Glue 是一项完全托管的提取、转换和加载 (ETL) 服务,可让客户更轻松地准备和加载数据以进行分析。Glue 是一项“无服务器”服务,您无需预置或管理任何资源,并且只需在 Glue 有效运行时为资源付费。
使用 Amazon Redshift 通过配额机制监控及控制 schema 存储空间
本文还向大家展示了如何轻松在Amazon Redshift schema当中控制存储配额。我们不仅完成了schema之上创建并变更配额,同时授权特定用户使用该schema的操作步骤,同时也探讨了如何将数据导入schema并通过系统视图在多种用例下监控事务结果及磁盘使用量。通过这项强大的功能,相信大家能够通过Amazon Redshift切实满足各类业务需求。
Amazon EMR Managed Scaling 介绍——自动调整集群大小,高效节约运营成本
本文探讨了EMR Managed Scaling功能,它可以自动调整集群大小,借此以最低成本实现最佳性能。
Amazon Redshift Federated Query 最佳实践
本文回顾了能够帮助大家尽可能提升Amazon Redshift联邦查询性能的十项最佳实践。当然,每项实践都对应特定用例,请在具体采用之前认真评估您的当前场景是否与之匹配。 AWS将继续增强并改进Amazon Redshift Federated Query,也欢迎大家提供反馈意见。如果您有任何疑问或建议,请在评论中与我们交流。如果您需要进一步帮助以优化Amazon Redshift集群,请联系您的AWS客户服务团队。
如何在 ADFS 与 AWS 之间建立信任,并通过 Active Directory 凭证配合 ODBC 驱动程序接入 Amazon Athena
本文展示了如何在Active Directory当中配置ADFS 3.0,并将其作为IdP以使用SAML实现与AWS的身份验证联动。本文还探讨了如何将Athena ODBC驱动程序集成至ADFS,以及如何直接使用Active Directory凭证接入Athena。通过将Active Directory与Athena ODBC驱动程序集成起来,我们可以更灵活地通过各类熟悉的商务智能工具访问Athena,使用SQL分析Amazon S3中的数据且完全无需创建单独的IAM用户。
在EMR 6.0.0 中使用 Docker 简化您的 Spark 依赖项管理
本文向大家讲解了如何使用Amazon EMR 6.0.0与Docker简化Spark中的依赖项管理流程。我们创建一套Docker镜像以打包现有Python依赖项,创建一个集群并将其设定为使用Docker运行时,而后将创建的Docker镜像与EMR Notebook配合使用以运行PySpark作业。
Komodo Health 公司如何在 EKS 与 EMR 6 上使用多租户 Notebook 平台建立自助服务分析方案
在EMR上使用Spark,可以在基础设施抽象与管理之间达成适当的平衡,同时帮助我们实现粗粒度配置以保证数据科学家及工程师及时获得所需工具。在Route 53与ALB等多种AWS服务的帮助下,整个部署流程也变得更加轻松易行。