发布于: Jan 20, 2022
亚太地区(大阪)的 Amazon Relational Database Service (Amazon RDS) 现在提供以 Apache Parquet 格式将快照数据导出至 S3 的功能,这是一种用于分析的高效开放列式存储格式。与文本格式相比,Parquet 格式的导出速度提高了 2 倍,并且在 Amazon S3 中耗用的存储量减少了 6 倍。导出的数据可以使用 Amazon Athena 和 Amazon SageMaker 等 AWS 工具或 Apache Spark 等开源大数据框架进行分析。
使用 Amazon RDS 管理控制台,或者使用 AWS 开发工具包或 CLI,只需单击几下即可导出数据。数据是从快照而不是数据库实例中提取,因此对活动数据库不会产生性能影响。
Amazon RDS 快照导出至 S3 的功能可从 Amazon RDS for PostgreSQL、Amazon RDS for MariaDB、Amazon RDS for MySQL、Amazon Aurora PostgreSQL 和 Amazon Aurora MySQL 快照导出数据,目前已在亚太地区(大版)推出。
要开始使用,请参考以下资源: