AWS Big Data | 亚马逊AWS官方博客

如何在不停机的情况下将大型数据仓库从 IBM Netezza 迁移到 Amazon Redshift 中

在本文中，我们将说明此客户如何在不需要停机的情况下将大型数据仓库从 IBM Netezza 迁移到 Amazon Redshift，然后再说明如何遵照计划充分的迁移过程及利用 AWS Schema Conversion Tool (SCT) 和 Amazon Redshift 最佳实践。

利用 Active Directory 联合身份访问基于 Amazon Elasticsearch Service 的 Kibana

AWS最近发布了 Amazon Elasticsearch Service 与 Amazon Cognito 集成的服务，现在企业用户在使用 Kibana访问 Amazon Elasticsearch Service时，可以使用企业目录凭证来进行联合身份认证

如何为 Amazon S3 中的 AWS KMS 加密数据启用跨账户 Amazon Redshift COPY 和 Redshift Spectrum 查询

此博文显示了如何使用 Amazon S3 中的示例数据集设置跨账户 Amazon Redshift COPY 和 Spectrum 查询的逐步演练。示例数据集使用 AWS KMS 托管的密钥 (SSE-KMS) 进行静态加密。

使用 AWS CloudFormation 自动创建 Amazon Redshift 集群

在本博文中，我将介绍如何在 AWS 账户中自动部署 Amazon Redshift 集群。有关安全性和高可用性的 AWS 最佳实践有助于集群配置，并且您可以使用 AWS CloudFormation 快速创建集群。我将向您介绍一组 CloudFormation 示例模板，您可以根据需要对其进行自定义。

为共享和协作而优化的现代分析平台 –使用 Mode 和 Amazon Redshift建设分析堆栈

通过本博文，您将了解：
1. 商业智能 (BI) 现代化的发展各个阶段。此部分将介绍组织在没有真正对分析平台进行现代化改造的情况下采用现代 BI 工具时会出现的问题。
2. 将使用仪表盘和notebook笔记本的解决方案与高效数据管道集于一体的云优先数据科学平台将会以何种方式呈现。
3. 对上述平台进行快速复制的步骤。可以将协作分析解决方案（例如 Mode，Amazon Redshift 合作伙伴之一）与基于 AWS 数据仓库、ETL 和数据探索服务的强大分析基础工具相结合。

授予对 Amazon Redshift 管理控制台的细粒度访问权限

Amazon Redshift 是一项完全托管的服务，它的设计宗旨是易于设置和使用。在本博文中，我们将演示如何为某一运营组中的用户授予访问权限，以便他们仅在 Amazon Redshift 管理控制台中执行特定操作。如果您实施自定义 IAM 策略，则可以对其进行设置，以便这些用户可以监控和终止正在运行的查询。同时，您可以防止这些用户执行其他需要更多权限的操作，例如修改、重启或删除 Amazon Redshift 集群。

通过 Amazon Athena 进行无服务器架构的大数据分析

互联网时代带来了数据量的海量增长，数据驱动业务决策成为大势所趋。分析人员迫切的希望能快速的交互式的从海量的数据中抓取有用的信息来辅助决策。在AWS上，Amazon S3对象存储服务由于其高可用性，高持久性，可扩展性和数据格式兼容性等特点成为建设存储海量数据的数据湖的首选。Amazon Athena可以轻松对Amazon S3中的数据进行交互式查询，是一款开箱即用、无需运维的全托管服务。

使用 R 完成基于 Amazon Athena 交互分析

在本博文中，将通过在 Amazon EC2 实例上运行的 R/RStudio Server 与 Athena 相连接，之后通过浏览器连接RStudio Server执行SQL语句查询S3内的数据。

利用 AWS Lake Formation 探索元数据：第 2 部分

在本博文系列的第 1 部分中，您学习了如何使用 Lake Formation 来创建和探索数据湖。本博文将引导您使用控制台中的 Lake Formation 的元数据搜索功能来发现数据，并了解受列权限限制的元数据搜索结果

使用 AWS Lake Formation 构建、保护和管理数据湖

传统上，组织将数据保存在固化、单一用途的系统中，例如本地数据仓库设备。同样，他们使用单一方法来分析数据，例如预定义的 BI 报告。在数据库之间移动数据以使用不同方法（例如机器学习 (ML) 或即兴使用的 SQL 查询）来分析数据时，需要在分析之前进行“提取、转换、加载” (ETL) 处理。这些传统方法即便再好，也是效率低下且存在延迟的。最糟糕的是存在复杂的安全性。

亚马逊AWS官方博客

Category: AWS Big Data