Publié le: Sep 21, 2021

Amazon SageMaker annonce un nouvel ensemble de fonctionnalités qui permettront un traitement interactif des données basé sur Spark à partir des blocs-notes SageMaker Studio. Amazon SageMaker Studio est le premier environnement de développement entièrement intégré (IDE) dédié au machine learning (ML). SageMaker Studio offre une interface visuelle unique, basée sur le web, où vous pouvez effectuer toutes les étapes de développement ML nécessaires pour préparer les données, ainsi que pour créer et entraîner les modèles. D'un simple clic, les scientifiques des données et les développeurs peuvent rapidement lancer des blocs-notes Studio pour explorer de manière interactive des jeux de données et créer des modèles ML.

À partir d'aujourd'hui, les scientifiques des données et les ingénieurs des données peuvent naviguer dans les environnements de traitement de données Spark fonctionnant sur Amazon EMR, les découvrir et s'y connecter directement à partir de leurs blocs-notes Studio en quelques clics. Une fois connectés, ils peuvent interroger, explorer et visualiser des données de manière interactive, et exécuter des tâches Spark à l'aide des environnements de bloc-note intégrés SparkMagic pour Python et Scala.

L'analyse, la transformation et la préparation de grandes quantités de données est une étape fondamentale de toute science des données et du flux ML, et les entreprises tirent parti d'Apache Spark pour préparer rapidement les données. SageMaker Studio offre déjà des outils spécialisés et de premier ordre tels qu'Experiments, Clarify et Model Monitor pour ML. Grâce à cette nouvelle fonctionnalité, les clients peuvent facilement accéder à des environnements Spark spécialement conçus à partir des blocs-notes Studio. SageMaker Studio peut donc désormais servir d'environnement unifié pour les flux de science des données et d'ingénierie des données, ce qui permet aux clients de standardiser les flux sur les blocs-notes Studio.

Ces nouvelles fonctionnalités d'analytique des données dans SageMaker Studio sont généralement disponibles dans toutes les régions AWS où SageMaker Studio est disponible; et il n'existe aucuns frais supplémentaires pour utiliser cette fonctionnalité. Pour obtenir des informations complètes sur la disponibilité régionale et la tarification, consultez la page de la tarification SageMaker Studio. Pour en savoir plus, consultez « Préparation interactive des données avec les blocs-notes Studio » dans le guide de l'utilisateur SageMaker Studio.