大数据 | 亚马逊AWS官方博客

使用 AWS Glue 蓝图将数据库中的数据大规模登陆到数据湖

在本文中，您将通过维护一个包含表名和几个参数的 JSON 文件，学习如何以标准化方式处理数据湖登陆作业部署。您可以进一步自定义亚马逊云科技 Glue 蓝图，创建自己的多步骤数据管道，将数据移动到下游层和专用的分析服务。

使用 AWS CloudFormation 和 AWS CLI 自动管理 Amazon Redshift Serverless 数据仓库

在本文中，我们将讨论如何使用亚马逊云科技 CloudFormation 和亚马逊云科技 CLI 自动管理 Redshift Serverless 数据仓库所涉及的各种任务。

消除复杂性以提高业务绩效：Bridgewater Associates 如何在 AWS 上构建安全、可扩展且基于 Spark 的研究服务

Bridgewater 的核心使命是通过分析市场驱动因素来理解世界的运作方式，并将这种理解转化为高质量的投资组合，为我们的客户提供投资建议。在 Bridgewater Technology 内，我们努力使我们的研究人员在他们最擅长的领域尽可能提高工作效率：建立对全球市场的基本理解。这意味着不再需要处理底层 IT 基础设施，而是专注于构建和改进他们的投资理念。

使用 Amazon Athena 和 Amazon Managed Grafana 直观地呈现 Amazon S3 数据

Grafana 是一个热门的开源分析平台，您可以使用该平台，通过灵活的控制面板创建、浏览和分享数据。其使用案例 […]

AWS 专用数据库的优势 Vlad Vlasceanu 问答

托管数据库服务是由 AWS 管理和维护的云数据库，使您的数据库管理员和开发团队可以专注于应用程序和架构管理。

Amazon DynamoDB 中的单表与多表设计

对于了解 Amazon DynamoDB 的人士来说，单表设计的想法是目前最令人费解的概念之一。与每个实体有一个表的关系概念不同，DynamoDB 表通常在一个表中包含多个不同的实体。您可以阅读 DynamoDB 文档，观看 re:Invent 讲座或其他视频，或者查看我的书，了解 DynamoDB 中使用单表设计的一些设计模式。我想在更高层次上探讨这个话题，重点介绍支持和反对单表设计的论点。

使用 Aurora Global Database 以尽可能短的停机时间在各个 AWS 区域迁移 Amazon Aurora

Amazon Aurora 是一款专为云而构建的关系数据库管理系统（RDBMS），完全兼容 MySQL 和 PostgreSQL。Aurora 旨在利用云在可扩展性、可用性和持久性方面的优势，并将高端商用数据库的速度和可靠性与开源数据库的简单性和成本效益相结合。

在 Amazon Aurora PostgreSQL 兼容版上管理长时间运行的读取查询

Amazon Aurora PostgreSQL 兼容版集群由一个主/写入器节点和一个区域中多达 15 个读取器节点组成。您可以将只读工作负载卸载到读取器节点以进行横向扩展读取。如果读取器节点正在访问主节点上具有大量事务活动的表，则在读取器节点上长时间运行的查询可能会导致冲突，并导致不良影响。在这篇博文中，我们将探讨潜在的冲突，并分享在 Aurora PostgreSQL 上管理长时间运行的读取查询的最佳实践。

Amazon Redshift 数据共享最佳实践和考虑因素

Amazon Redshift 是一个快速、完全托管式云数据仓库，可简化并使通过标准的 SQL 和您的现有商业智能（BI）工具对您的全部数据进行分析变得更具成本效益。借助 Amazon Redshift 数据共享，您可以安全轻松地在 Amazon Redshift 集群之间共享实时数据以供读取。

在现代数据架构中将 Amazon Redshift RA3 与托管存储结合使用

多年来，Amazon Redshift 发生了很大变化。最新一代产品为我们的客户积极采纳的几种现代数据架构模式提供了支持，以构建灵活且可扩展的分析平台。

Tag: 大数据