Publicado: Jan 11, 2022

Agora você pode usar o Amazon Redshift Spectrum para especificar regras de validação de dados personalizadas em suas tabelas externas ao consultar o data lake do Amazon S3. Essa melhoria permite controlar como o Redshift Spectrum processa os dados com valores inesperados, como caracteres UTF-8 incompatíveis ou excesso numérico em suas tabelas externas.

O Amazon Redshift Spectrum já conta com regras internas para resolver valores inesperados em seus dados. Por exemplo, o Redshift Spectrum define o valor de uma coluna como nulo quando a coluna contém qualquer caractere especial não permitido e trunca o valor da coluna quando ele é maior do que a largura definida para a coluna. Agora você pode substituir as regras internas. Por exemplo, você pode especificar se deseja substituir o caractere inesperado, gerar uma falha na consulta ou ignorar a linha quando o Redshift Spectrum encontra dados desse tipo. 

Para saber mais, consulte Definição das opções de processamento de dados com o Redshift Spectrum no Guia do desenvolvedor do banco de dados do Amazon Redshift.