投稿日: May 12, 2023
AWS Glue クローラーでは、データソースからデータスキーマを抽出して AWS Glue データカタログに追加する際に、ユーザー独自のカスタム JDBC ドライバーを使用できるようになりました。Glue クローラーでは既に、AWS でサポート済みのデータソースへの JDBC Glue 接続に対応しています。今後は、現在お使いの JDBC ドライバーのバージョンで、Glue クローラーのデータソースに接続できます。これらのデータソースには、Postgres、MySQL、Oracle、SQL Server、Amazon Redshift が含まれます。
お使いの JDBC ドライバーを使用するには、そのドライバーファイルを Amazon S3 バケットに追加します。次に、JDBC ドライバーの S3 パスとクラス名を使用して Glue 接続を設定します。Glue クローラーを実行するたびに、指定した JDBC ドライバーを使用して Glue ジョブが開始され、スキーマを検査します。その後、Glue クローラーはスキーマの新規テーブル、削除、更新などのスキーマ情報を AWS Glue データカタログに書き込みます。AWS Glue を使用すると、これらのデータソースからデータを取得し、Amazon S3 ターゲットに入力するためのソースとして、AWS Glue データカタログを使用できるようになります。
AWS Glue クローラーのカスタム JDBC ドライバーのサポートは、AWS Glue が提供されているすべての商用リージョンでご利用いただけます。AWS リージョン表を参照してください。詳細については、AWS Glue クローラーのドキュメントを参照してください。