게시된 날짜: Aug 31, 2020
EMR Notebooks는 임시 작업을 쓰고 해당 작업으로 실험하는 데이터 사이언티스트와 엔지니어가 사용하는 완전관리형, Jupyter 기반 노트북 서비스입니다. 이제 EMR Notebooks를 비대화형 방식으로 오케스트레이션하여 특히 프로덕션에서 ETL 워크로드를 실행할 수 있습니다. 이 기능이 생기기 전에는 노트북을 실행하려면 AWS Management Console을 통해 Jupyter 사용자 인터페이스에 액세스해야 했습니다.
EMR Notebooks API는 노트북에 대한 AWS CLI 및 SDK 액세스를 지원하므로 자동화된 방식으로 노트북을 사용해 ETL 워크로드를 실행할 수 있습니다. AWS Step Functions 및 Apache Airflow와 같은 오케스트레이션 서비스를 활용하여 복원력이 우수한 워크플로를 구축한 다음 cron 스크립트를 사용하여 비대화형으로 예약한 일정에 맞춰 노트북을 실행할 수도 있습니다. 또한, 노트북에 입력 파라미터를 전달하여 각 실행의 이전 출력에 액세스함으로써 노트북의 모든 실행을 디버깅할 수도 있습니다. 이 기능이 생기기 전에는 새로운 입력 값 조합마다 노트북의 새 사본을 만들어 변경해야만 했습니다.
EMR Notebooks를 시작하려면 EMR Notebooks 페이지를 참조하세요.
이 기능은 EMR Notebooks를 이용할 수 있는 리전에서 EMR 릴리스 버전 5.18.0 이상부터 사용할 수 있습니다.