Publicado: Jan 23, 2020
Agora você pode exportar snapshots do Amazon Relational Database Service (Amazon RDS) ou do Amazon Aurora para o Amazon S3 no formato Apache Parquet, um eficiente formato aberto de armazenamento colunar para análises. O formato Parquet é até duas vezes mais rápido para exportar e consome até seis vezes menos armazenamento no Amazon S3 em comparação a formatos de texto. Você pode analisar os dados exportados usando outros serviços da AWS, como Amazon Athena, Amazon EMR e Amazon SageMaker.
É possível criar uma exportação com apenas alguns cliques no Console de gerenciamento do Amazon RDS ou usando o SDK ou a ILC da AWS. A extração de dados de um snapshot não afeta a performance de seu banco de dados, pois a operação de exportação é realizada em seu snapshot e não em seu banco dados. Os dados extraídos no formato Apache Parquet são portáteis, permitindo consumi-los com serviços de consulta, como o Amazon Athena ou com estruturas de processamento de big data, como o Apache Spark. Para mais informações, inclusive as instruções para começar a usar, leia a documentação do Aurora ou a documentação do Amazon RDS.
A exportação de snapshot do Amazon RDS para o S3 pode exportar dados de snapshot do Amazon RDS for PostgreSQL, Amazon RDS for MariaDB, Amazon RDS for MySQL, Amazon Aurora PostgreSQL e Amazon Aurora MySQL, e já está disponível nas regiões Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), UE (Irlanda) e Ásia-Pacífico (Tóquio).
O Amazon Aurora é um banco de dados relacional compatível com MySQL e PostgreSQL criado para a nuvem e que combina a performance e a disponibilidade de bancos de dados empresariais tradicionais com a simplicidade e a economia de bancos de dados de código aberto. Saiba mais sobre o Amazon Aurora acessando a página do produto.