- Amazon SageMaker›
- Amazon SageMaker Data Processing›
- Questions fréquentes (FAQ)
FAQ sur Amazon SageMaker Data Processing
Questions d’ordre général
Qu’est-ce qu’Amazon SageMaker Data Processing ?
SageMaker Data Processing analyse, prépare, intègre et orchestre vos données grâce aux fonctionnalités de traitement d’Amazon Athena, Amazon EMR, AWS Glue et Amazon Managed Workflows pour Apache Airflow (Amazon MWAA). Vous pouvez utilise des cadres de traitement de données open source tels qu’Apache Spark, analyser des données à grande échelle avec Trino et créer une analytique en temps réel de manière fluide avec Apache Flink et Apache Spark.
Quels sont les services inclus dans SageMaker Data Processing ?
SageMaker Data Processing réunit Amazon EMR, Athena, AWS Glue et Amazon MWAA.
Pourquoi utiliser SageMaker Data Processing ?
SageMaker Data Processing vous aide à explorer les données, à créer des tâches de transformation des données, à orchestrer et à déployer des pipelines de données à grande échelle. Il améliore les performances et fournit des informations plus rapidement que les systèmes open source traditionnels grâce à des versions rentables et compatibles avec les API open source d’Apache Spark, Apache Airflow, Apache Flink, Trino, etc. SageMaker Data Processing permet d’accéder à vos sources de données dans Amazon SageMaker via des intégrations zéro ETL, des fonctionnalités de requêtes fédérées et des connecteurs.
Migration et accès
Dois-je migrer vers SageMaker pour utiliser les services existants tels qu’Amazon EMR, Athena ou AWS Glue ?
Non, vous n’avez pas besoin de migrer vers SageMaker. Vous pouvez continuer à utiliser Amazon EMR, Athena, AWS Glue et Amazon MWAA comme vous le faites aujourd’hui. Cependant, nous vous recommandons de commencer à utiliser SageMaker pour utiliser des outils unifiés, de la gouvernance des données intégrée et des architectures SageMaker Lakehouse simplifiées.
Qu’arrive-t-il aux tâches, aux requêtes, au code et aux ressources que j’ai déjà créés ou que je prévois de créer dans Amazon EMR, Athena ou AWS Glue ?
Cela n’a aucun impact sur le code actuel, les requêtes, les tâches et les autres ressources que vous avez créés et utilisés avec Amazon EMR, Athena ou AWS Glue. Vous pouvez continuer à utiliser ces services pour les nouvelles charges de travail, si vous le souhaitez. Les ressources créées dans ces services, comme Amazon EMR sur les clusters Amazon Elastic Compute Cloud (Amazon EC2), sont visibles dans SageMaker afin de simplifier le développement d’applications d’analytique et d’IA. Les expériences de développement existantes intégrées à Amazon EMR, AWS Glue et Athena continueront d’exister, en plus d’une nouvelle expérience de développement au sein de SageMaker.
Quelle version d’AWS Glue est disponible dans SageMaker ?
La dernière version d’AWS Glue, AWS Glue 5.0, est disponible dans SageMaker. AWS Glue 5.0 accélère les charges de travail liées au traitement des données et fournit la dernière exécution Apache Spark 3.5.2 optimisée pour les performances, afin que vous puissiez développer, exécuter et mettre à l’échelle pour obtenir des informations plus rapides. Pour en savoir plus, consultez la page AWS Glue.
Tarification
Quel est le modèle de tarification de SageMaker Data Processing ?
Chaque service AWS que vous utilisez via SageMaker est soumis à sa propre tarification. Pour plus de détails, consultez la page de tarification AWS pour Athena, Amazon EMR, AWS Glue et Amazon MWAA.