- Amazon SageMaker›
- Amazon SageMaker Data Processing›
- Perguntas frequentes
Perguntas frequentes sobre o Amazon SageMaker Data Processing
Geral
O que é o Amazon SageMaker Data Processing?
O SageMaker Data Processing realiza a análise, a preparação, a integração e a orquestração dos seus dados ao usar as funcionalidades de processamento do Amazon Athena, do Amazon EMR, do AWS Glue e do Amazon Managed Workflows for Apache Airflow (Amazon MWAA). É possível usar as estruturas de processamento de dados de código aberto, como o Apache Spark, para analisar dados em grande escala com o Trino e para desenvolver analytics em tempo real de forma integrada com o Apache Flink e com o Apache Spark.
Quais são os serviços incluídos no SageMaker Data Processing?
O SageMaker Data Processing reúne o Amazon EMR, o Athena, o AWS Glue e o Amazon MWAA.
Quais são os benefícios de usar o SageMaker Data Processing?
O SageMaker Data Processing auxilia na exploração de dados, na criação de trabalhos de transformação de dados, na orquestração e na implantação de pipelines de dados em grande escala. A solução aprimora a performance, proporcionando insights mais rápidos quando comparados com os sistemas tradicionais de código aberto ao usar versões econômicas e compatíveis com APIs de código aberto do Apache Spark, Apache Airflow, Apache Flink, Trino e outros. O SageMaker Data Processing disponibiliza o acesso às fontes de dados no Amazon SageMaker Lakehouse por meio de integrações ETL zero, funcionalidades de consulta federada e conectores.
Migração e acesso
Devo realizar a migração para o SageMaker para usar serviços existentes como o Amazon EMR, o Athena ou o AWS Glue?
Não, você não precisa migrar para o SageMaker. Você pode continuar usando o Amazon EMR, o Athena, o AWS Glue e o Amazon MWAA da mesma forma que faz hoje. Entretanto, recomendamos que você comece a usar o SageMaker para utilizar as ferramentas unificadas, a governança de dados integrada e as arquiteturas simplificadas do SageMaker Lakehouse.
O que acontece com os trabalhos, consultas, códigos e recursos que já foram criados ou que estão planejados para o Amazon EMR, o Athena ou o AWS Glue?
Não haverá impacto no código, nas consultas, nos trabalhos e em outros recursos atuais que você criou e usou com o Amazon EMR, o Athena ou o AWS Glue. É possível continuar a usar esses serviços para novas workloads, se preferir. Os recursos criados nesses serviços, como clusters do Amazon EMR no Amazon Elastic Compute Cloud (Amazon EC2), podem ser visualizados no SageMaker para simplificar o desenvolvimento de aplicações de analytics e de IA. As experiências de desenvolvimento existentes incorporadas no Amazon EMR, no AWS Glue e no Athena continuarão disponíveis, além de fornecerem uma nova experiência de desenvolvimento no SageMaker.
Qual versão do AWS Glue está disponível no SageMaker?
A versão mais recente do AWS Glue, o AWS Glue 5.0, está disponível no SageMaker. O AWS Glue 5.0 acelera as workloads de processamento de dados e oferece o runtime mais recente do Apache Spark 3.5.2 com performance otimizada, permitindo que você desenvolva, execute e escale para obter insights mais rápidos. Para saber mais informações, acesse AWS Glue.
Preços
Qual é o modelo de preços do SageMaker Data Processing?
Cada serviço da AWS usado por meio do SageMaker está sujeito à própria estrutura de preços. Para obter mais detalhes, consulte a página de preços da AWS para o Athena, Amazon EMR, AWS Glue e Amazon MWAA.