发布于: Jan 23, 2020
现在,您可以将 Amazon Relational Database Service (Amazon RDS) 或 Amazon Aurora 快照作为 Apache Parquet 格式导出到 Amazon S3,这是一种用于分析的高效开放列式存储格式。与文本格式相比,Parquet 格式的导出速度提高了 2 倍,并且在 Amazon S3 中耗用的存储量减少了 6 倍。您可以使用 Amazon Athena、Amazon EMR 和 Amazon SageMaker 之类的其他 AWS 服务分析导出的数据。
只需在 Amazon RDS 管理控制台上单击几次或者使用 AWS SDK 或 CLI 即可创建导出。从快照提取数据不会影响数据库的性能,因为导出操作是对快照执行而非对数据库执行。提取的 Apache Parquet 格式的数据便携性好,因此您可以将其用于 Amazon Athena 之类的查询服务,或 Apache Spark 之类的大数据处理框架。有关更多信息(包括关于入门的说明),请阅读 Aurora 文档或 Amazon RDS 文章。
Amazon RDS 快照导出至 S3 的功能可从 Amazon RDS for PostgreSQL、Amazon RDS for MariaDB、Amazon RDS for MySQL、Amazon Aurora PostgreSQL 和 Amazon Aurora MySQL 快照导出数据,目前在美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、欧洲(爱尔兰)和亚太地区(东京)区域可用。
Amazon Aurora 是一种与 MySQL 和 PostgreSQL 兼容的关系数据库,专为云而打造,既具有传统企业数据库的性能和可用性,又具有开源数据库的简单性和成本效益。有关 Amazon Aurora 的更多信息,请访问产品页面。