게시된 날짜: Jan 11, 2022

Amazon EMR Studio는 데이터 사이언티스트와 데이터 엔지니어가 R, Python, Scala 및 PySpark에서 작성한 빅 데이터 및 분석 애플리케이션을 쉽게 개발, 시각화 및 디버깅할 수 있도록 지원하는 통합 개발 환경(IDE)입니다. 오늘 EMR Studio에서 데이터 카탈로그를 검색하고 EMR 클러스터에 대한 SQL 쿼리를 실행할 수 있는 EMR Studio Workspace의 기능인 SQL Explorer를 소개하게 되어 기쁘게 생각합니다. EMR Studio의 이번 SQL Explorer 릴리스는 Amazon EMR에서 Presto 버전 0.254.1 이상을 실행하는 EC2 클러스터에 대한 SQL 쿼리 실행을 지원합니다. 

Presto는 여러 소스의 대규모 데이터 집합에 대한 대화형 분석 쿼리를 처리하도록 설계된 빠른 SQL 쿼리 엔진입니다. SQL Explorer에서는 Presto가 설치된 EC2 클러스터의 Amazon EMR에 연결하여 데이터 카탈로그를 표시하고 찾아볼 수 있습니다. 지원되는 데이터 카탈로그에는 AWS Glue 데이터 카탈로그와 자체 호스팅된 Hive Metastore 버전 3.1.2 이상이 포함됩니다. 또한 SQL Explorer는 SQL 쿼리를 실행하고, 테이블에서 조회 결과를 보고, 조회 결과를 csv 형식으로 다운로드할 수 있는 편집기를 제공합니다. 또한 다른 편집기 탭을 통해 여러 SQL 문을 실행할 수 있습니다. SQL Explorer는 Amazon EMR 버전 6.4.0 이상에서 지원됩니다.

EMR Studio는 미국 동부(오하이오), 미국 동부(버지니아 북부), 미국 서부(오레곤), 캐나다(중부), EU(아일랜드), EU(프랑크푸르트), EU(런던), EU(스톡홀름), EU(파리), 아시아 태평양(뭄바이), 아시아 태평양(서울), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(도쿄) 및 남아메리카(상파울루) 리전에서 사용 가능합니다.

EMR Studio의 SQL Explorer에 대한 자세한 내용은 여기의 설명서를 참조하세요. 이 기능의 실제 사용 사례는 여기의 데모 동영상을 참조하세요.