Publié le: Oct 5, 2018
Vous pouvez désormais créer un bloc-notes Amazon SageMaker à partir de la console AWS Glue et le connecter à un point de terminaison de développement AWS Glue. Cette intégration vous permet désormais d’utiliser les blocs-notes entièrement gérés Amazon SageMaker plutôt que de mettre en service et gérer vos propres serveurs de blocs-notes, ce qui simplifie et accélère le démarrage du développement de vos scripts ETL AWS Glue. Un point de terminaison de développement AWS Glue est un environnement Apache Spark sans serveur que vous pouvez utiliser pour développer, déboguer et tester de manière interactive vos scripts ETL AWS Glue. Pour en savoir plus, consultez notre documentation.
Par ailleurs, vous pouvez utiliser la bibliothèque Amazon SageMaker Spark sur les points de terminaison de développement AWS Glue. Il s’agit d’une bibliothèque Apache Spark à code source libre pour Amazon SageMaker. Elle vous permet d’entrelacer les phases Apache Spark et celles qui interagissent avec Amazon SageMaker dans vos pipelines de ML Apache Spark. Vous pouvez ainsi former des modèles à l’aide des DataFrames Apache Spark dans Amazon SageMaker en utilisant les algorithmes ML fournis par Amazon, tels que K-moyennes (algorithme de clustering) ou XGBoost.
AWS Glue est disponible dans les régions AWS USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon), UE (Francfort), UE (Irlande), Asie-Pacifique (Séoul), Asie-Pacifique (Sydney) et Asie-Pacifique (Tokyo). Pour la disponibilité d’AWS Glue, consultez le tableau des régions AWS.