게시된 날짜: Nov 17, 2023
AWS Glue for Apache Spark는 Teradata, SAP HANA, Azure SQL, Azure Cosmos DB, Vertica, MongoDB용으로 6가지 새로운 데이터베이스 커넥터를 출시한다고 발표했습니다. 이러한 네이티브 커넥터를 사용하면 사용자가 커넥터 라이브러리를 설치하거나 관리할 필요 없이 이러한 시스템에서 데이터를 효율적으로 읽고 쓸 수 있습니다. 사용자는 AWS Glue Studio의 노코드 드래그 앤 드롭 시각적 인터페이스에서 이러한 데이터베이스를 소스 또는 대상으로 추가하거나, AWS Glue ETL 스크립트 작업에서 직접 커넥터를 사용할 수 있습니다.
Teradata, SAP HANA, Azure SQL, Vertica의 경우, 사용자는 단일 테이블을 지정하거나 사용자 지정 쿼리를 입력하여 데이터를 선택할 수 있습니다. MongoDB의 경우, 문서 컬렉션을 지정할 수 있습니다. Azure Cosmos DB의 경우, 컨테이너를 지정하고 선택적으로 사용자 지정 쿼리를 제공할 수 있습니다. 시각적 ETL 작업을 작성할 때는 소스 데이터 세트를 미리 보고 적절한 데이터를 더 빨리 찾을 수 있습니다. 아울러 사용자는 ETL 파이프라인에서 이러한 데이터베이스를 대상으로 사용하여 변환 단계의 출력을 작성할 수도 있습니다.
ETL 개발자는 이러한 기능을 통해 단일 인터페이스 내의 다양한 데이터 상황에 걸쳐 AWS Glue 및 지원되는 데이터베이스로 작업할 수 있습니다. 시작하려면 AWS Glue 내에 원하는 데이터베이스에 대한 새 연결을 생성하고 이를 Glue ETL 작업에 소스 또는 대상으로 추가하면 됩니다.
이 기능은 AWS Glue가 제공되는 모든 상용 AWS 리전에서 사용할 수 있습니다.
자세한 내용은 AWS Glue 설명서를 참조하세요.