发布于: Jan 11, 2022

现在,在查询 Amazon S3 数据湖时,您可以使用 Amazon Redshift Spectrum 为外部表指定自定义数据验证规则。此增强功能允许您控制 Redshift Spectrum 如何处理包含意外值的数据,例如外部表中不支持的 UTF-8 字符或数字溢出。

Amazon Redshift Spectrum 已经提供内置规则来处理数据中的意外值。例如,当列包含任何不受支持的特殊字符时,Redshift Spectrum 将列的值设置为 null,当列的值大于定义的列宽时,将截断该列的值。现在,您可以覆盖内置规则。例如,您可以指定当 Redshift Spectrum 遇到此类数据时,是替换意外字符、查询失败还是忽略该行。 

要了解更多信息,请参阅Amazon Redshift 数据库开发人员指南中的使用 Redshift Spectrum设置数据处理选项