Publié le: Aug 31, 2020
EMR Notebooks est un service qui fournit un bloc-notes entièrement géré, basé sur Jupyter, aux scientifiques des données et aux ingénieurs qui écrivent des tâches ad hoc et les expérimentent. Vous pouvez désormais orchestrer EMR Notebooks de manière non interactive pour exécuter des charges de travail ETL, en particulier en production. Avant l'apparition de cette fonctionnalité, l'accès à l'interface utilisateur Jupyter via AWS Management Console était nécessaire pour exécuter des notebooks.
Les API EMR Notebooks permettent à l'interface de ligne de commande et au kit SDK AWS d'accéder aux blocs-notes afin que vous puissiez exécuter des charges de travail ETL à l'aide de blocs-notes de manière automatisée. Vous pouvez exploiter des services d'orchestration tels qu'AWS Step Functions et Apache Airflow pour créer des flux de travail résilients et exécuter des blocs-notes dans les délais de manière non interactive à l'aide de scripts cron. Vous pouvez également transmettre des paramètres d'entrée aux notebooks et déboguer toutes les exécutions d'un notebook en accédant aux sorties historiques de chaque exécution. Avant l'apparition de cette fonctionnalité, vous deviez créer une nouvelle copie du notebook et la modifier, pour chaque nouvelle combinaison des valeurs d'entrée.
Pour démarrer avec EMR Notebooks, consultez la page EMR Notebooks.
Cette fonction est disponible dans la version EMR 5.18.0 ou une version ultérieure dans les régions où EMR Notebooks est disponible.