Publicado: Dec 3, 2019
Agora, você pode transferir o resultado de uma consulta do Amazon Redshift para um data lake do Amazon S3 como Apache Parquet, um formato de armazenamento colunar aberto eficiente para análises. O formato Parquet é até duas vezes mais rápido para descarregar e consome até seis vezes menos armazenamento no Amazon S3 em comparação com os formatos de texto. Isso permite salvar a transformação e o enriquecimento de dados que você fez no Amazon Redshift no seu data lake do Amazon S3 em um formato aberto. Em seguida, você pode analisar seus dados com o Redshift Spectrum e outros serviços da AWS, como Amazon Athena, Amazon EMR e Amazon SageMaker.
Você pode especificar uma ou mais colunas de partição para que os dados descarregados sejam particionados automaticamente em pastas no seu bucket do Amazon S3. Por exemplo, você pode optar por descarregar seus dados de marketing e particioná-los nas colunas ano, mês e dia. Isso permite que suas consultas aproveitem a supressão de partições e ignorem a varredura de partições não relevantes, melhorando a performance da consulta e minimizando os custos.
Para obter mais informações, consulte a documentação do Amazon Redshift.
A exportação de data lake do Amazon Redshift é compatível com o Redshift versão 1.0.10480 ou posterior. Consulte a Tabela de regiões da AWS para saber mais sobre a disponibilidade do Amazon Redshift.