Publié le: Jan 11, 2022
Vous pouvez désormais utiliser Amazon Redshift Spectrum pour préciser des règles de validation de données personnalisées pour vos tables externes lors de l’interrogation du lac de données Amazon S3. Grâce à cette optimisation, vous pouvez contrôler la manière dont Redshift Spectrum traite les données contenant des valeurs inattendues telles que des caractères UTF-8 non pris en charge ou un dépassement numérique dans vos tables externes.
Amazon Redshift Spectrum fournit déjà des règles intégrées pour gérer les valeurs inattendues dans vos données. Par exemple, Redshift Spectrum définit la valeur d’une colonne comme nulle lorsque la colonne contient un caractère spécial non pris en charge et tronque la valeur de la colonne lorsqu’elle est plus large que la largeur de colonne définie. Vous pouvez à présent passer outre les règles intégrées. Par exemple, vous pouvez préciser s’il faut remplacer le caractère indésirable, faire échouer la recherche ou ignorer la ligne lorsque Redshift Spectrum rencontre de telles données.
Pour en savoir plus, consultez la section Définition des options de traitement des données avec Redshift Spectrum dans le guide du développeur de bases de données Amazon Redshift.