发布于: May 12, 2023
AWS Glue 爬网程序现支持客户自带自定义 JDBC 驱动程序,从数据来源提取数据架构并填充 AWS Glue Data Catalog。Glue 爬网程序已支持 JDBC Glue 连接到 AWS 上支持的数据来源。现在,您可以自带 JDBC 驱动程序版本以连接到 Glue 爬网程序中的数据来源。这些数据来源包括 Postgres、MySQL、Oracle、SQL Server 和 Amazon Redshift。
要使用您自己的 JDBC 驱动程序,请将驱动程序文件添加到 Amazon S3 存储桶。然后使用 JDBC 驱动程序 S3 路径和类名称配置 Glue 连接。每次运行 Glue 爬网程序时,都会使用提供的 JDBC 驱动程序启动 Glue 作业来检查架构。然后,Glue 爬网程序会在 AWS Glue Data Catalog 中对架构信息进行编目,例如新表、删除和架构更新。借助 AWS Glue,您现在可以使用 AWS Glue Data Catalog 作为来源,从这些数据来源中提取数据并填充 Amazon S3 目标。