投稿日: Jan 23, 2020

Amazon Relational Database Service (Amazon RDS) または Amazon Aurora のスナップショットを、分析用の効率的なオープンカラムナーストレージ形式である Apache Parquet として Amazon S3 にエクスポートできるようになりました。Parquet 形式は、テキスト形式と比較して、エクスポートが最大 2 倍速く、Amazon S3 でのストレージ使用量が最大 6 倍少なくすみます。エクスポートしたデータは、Amazon Athena、Amazon EMR、Amazon SageMaker などの他の AWS のサービスを使用して分析できます。

Amazon RDS マネジメントコンソールで数回クリックするだけで、あるいは AWS SDK または CLI を使用してエクスポートを行うことができます。エクスポート操作はデータベースではなくスナップショットで実行されるため、スナップショットからデータを抽出してもデータベースのパフォーマンスには影響しません。Apache Parquet 形式で抽出したデータは移植性があるため、Amazon Athena などのクエリサービスまたは Apache Spark などのビッグデータ処理フレームワークで使用できます。開始手順などの詳細については、Aurora のドキュメントまたは Amazon RDS のドキュメントを参照してください。

Amazon RDS スナップショットの S3 へのエクスポートは、Amazon RDS for PostgreSQL、Amazon RDS for MariaDB、Amazon RDS for MySQL、Amazon Aurora PostgreSQL、Amazon Aurora MySQL のスナップショットからデータをエクスポートできます。現在、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (アイルランド)、アジアパシフィック (東京) の各リージョンで利用可能です。

Amazon Aurora は、MySQL および PostgreSQL と互換性のあるクラウド向けのリレーショナルデータベースであり、従来のエンタープライズデータベースのパフォーマンスと可用性に加え、オープンソースデータベースのシンプルさとコスト効率性も兼ね備えています。Amazon Aurora の詳細については、製品ページを参照してください。