게시된 날짜: May 12, 2023
이제 AWS Glue 크롤러는 고객이 자체 사용자 지정 JDBC 드라이버를 가져와 데이터 소스에서 데이터 스키마를 추출하고 AWS Glue 데이터 카탈로그를 채울 수 있도록 지원합니다. Glue 크롤러는 AWS에서 지원되는 데이터 소스에 대한 JDBC Glue 연결을 이미 지원하고 있습니다. 이제 자체 JDBC 드라이버 버전을 가져와 Glue 크롤러의 데이터 소스에 연결할 수 있게 되었습니다. 이러한 데이터 소스에는 Postgres, MySQL, Oracle, SQL Server 및 Amazon Redshift가 포함됩니다.
자체 JDBC 드라이버를 사용하려면 Amazon S3 버킷에 드라이버 파일을 추가합니다. 그런 다음 JDBC 드라이버 S3 경로 및 클래스 이름을 사용하여 Glue 연결을 구성합니다. Glue 크롤러를 실행할 때마다 제공된 JDBC 드라이버를 사용하여 Glue 작업이 시작되고 스키마를 검사합니다. 그런 다음 Glue 크롤러는 AWS Glue 데이터 카탈로그의 스키마에 대한 새 테이블, 삭제, 업데이트와 같은 스키마 정보를 카탈로그화합니다. 이제 AWS Glue를 통해 AWS Glue 데이터 카탈로그를 소스로 사용하여 이러한 데이터 소스에서 데이터를 가져와 Amazon S3 대상을 채울 수 있습니다.