Publicado: Jun 8, 2020
Agora, você pode gravar os resultados de uma consulta do Amazon Redshift em uma tabela externa no Amazon S3 em formatos de texto ou Apache Parquet. Os metadados da tabela externa serão atualizados automaticamente, podendo ser armazenados no AWS Glue, no AWS Lake Formation ou no catálogo de dados do Hive Metastore. Isso permite que você compartilhe facilmente seus dados no data lake e os disponibilize imediatamente para análise com o Amazon Redshift Spectrum e outros serviços da AWS, como o Amazon Athena, o Amazon EMR e o Amazon SageMaker. O Amazon Redshift Spectrum permite acionar uma arquitetura de lake house para consultar e unir dados diretamente no seu data warehouse e data lake.
Para começar a gravar em tabelas externas, basta executar CREATE EXTERNAL TABLE AS SELECT para gravar em uma nova tabela externa ou executar INSERT INTO para inserir dados em uma tabela externa existente. Isso permite simplificar e acelerar pipelines de processamento de dados usando SQL familiar e uma integração perfeita com ferramentas de ETL e BI existentes. Você pode usar a opção PARTITIONED BY para particionar automaticamente os dados e aproveitar a ajuste de partições para melhorar o desempenho da consulta e minimizar os custos. Por exemplo, você pode gravar seus dados de marketing na sua tabela externa e optar por particioná-los por colunas de ano, mês e dia. Para obter mais informações, consulte a documentação do Amazon Redshift para CREATE EXTERNAL TABLE e INSERT.
O recurso de gravação em tabelas externas do Amazon Redshift é compatível com a versão 1.0.15582 ou posterior do Redshift. Consulte a Tabela de regiões da AWS para saber mais sobre a disponibilidade do Amazon Redshift.