AWS Glue Data Catalog, 이제 Amazon VPC를 통한 Apache Iceberg 자동 테이블 최적화 지원

게시된 날짜: 2024년 11월 21일

AWS Glue 데이터 카탈로그가 이제 특정 Amazon 가상 프라이빗 클라우드(VPC) 환경에서만 액세스할 수 있는 Apache Iceberg 테이블을 자동으로 최적화합니다. VPC 구성을 제공하여 테이블을 안전하게 유지하면서 스토리지를 최적화하고 쿼리 성능을 개선하는 방식으로 자동 최적화를 구현할 수 있습니다.

AWS Glue Data Catalog는 메타데이터 오버헤드를 줄이고, 스토리지 비용을 제어하고, 쿼리 성능을 개선하는 데 도움이 되는 압축, 스냅샷 보존 및 비참조 파일 관리를 지원합니다. Amazon S3 버킷이 특정 VPC에 있어야 하는 거버넌스 및 보안 구성을 보유한 고객은 이제 Glue Catalog와 함께 사용할 수 있습니다. 덕분에 Amazon S3의 어디에 저장되어 있든지 관계없이 Apache Iceberg 데이터를 자동으로 관리하는 광범위한 기능을 활용할 수 있습니다.

미국 동부(버지니아 북부, 오하이오), 미국 서부(오리건), 유럽(아일랜드, 런던, 프랑크푸르트, 스톡홀름), 아시아 태평양(도쿄, 서울, 뭄바이, 싱가포르, 시드니), 남아메리카(상파울루)의 13개 AWS 리전에서 Amazon VPC를 통한 Iceberg 테이블의 자동 최적화 기능을 사용할 수 있습니다. 고객은 AWS Console, AWS CLI 또는 AWS SDK를 통해 이를 활성화할 수 있습니다.

시작하려면 기본 보존 기간 및 참조되지 않은 파일을 보관할 날짜 같은 최적화 설정과 함께 Glue 네트워크 연결을 추가 구성으로 제공하면 됩니다. AWS Glue Data Catalog는 Glue 연결의 VPC 정보를 사용하여 Amazon S3 버킷에 액세스하고 Apache Iceberg 테이블을 최적화합니다.
자세히 알아보려면 블로그를 살펴보고 AWS Glue Data Catalog 설명서를 참조하세요.