게시된 날짜: Jun 14, 2018
이제 Amazon EMR에서 EMR 릴리스 5.14.0을 통해 JupyterHub를 사용할 수 있습니다. JupyterHub는 각 사용자에게 고유한 Jupyter Notebook 인스턴스를 제공하는 다중 사용자 Jupyter Notebook 서버입니다. 여러 사용자가 동시에 Jupyter Notebook을 사용하고, 코드를 생성 및 실행하고, 탐색적 데이터 분석을 수행할 수 있습니다. EMR의 JupyterHub는 Spark 프레임워크와 통합되므로 EMR 클러스터에서 Scala, PySpark, Spark R 및 Spark SQL 커널을 사용하여 대화형 Spark 쿼리를 수행할 수 있습니다. 또한 Python 작업을 로컬로 실행하고, Notebook에 미리 설치된 다수의 주요 데이터 과학 라이브러리를 활용할 수 있습니다. 이제 EMR 릴리스 5.14.0이 출시됨에 따라 S3용 Amazon EMR 커넥터인 EMRFS를 통해 S3 데이터에 액세스한 쿼리를 실행한 사용자에 대한 감사를 EMRFS에서 수행할 수 있습니다. 이 기능은 기본적으로 켜지며 사용자 및 그룹 정보를 CloudTrail 같은 감사 로그에 전달하여 요청을 종합적으로 추적할 수 있도록 합니다. 감사 기능에 더해 EMRFS는 일관성 보기, S3 서버 측 암호화 및 클라이언트 측 암호화 및 세분화된 S3 권한 부여 같은 기능을 제공합니다.
클러스터를 구성하고 시작할 때 설치할 애플리케이션 목록에서 “JupyterHub”를 선택하여 JupyterHub를 시작할 수 있습니다. EMR 릴리스 5.14.0, JupyterHub 및 EMRFS에 대한 자세한 내용은 Amazon EMR 설명서를 참조하십시오.
Amazon EMR 릴리스 5.14.0은 Amazon EMR을 지원하는 모든 리전에서 사용할 수 있습니다.