Publicado: Oct 5, 2018

Agora, você pode criar um bloco de anotações do Amazon SageMaker no console do AWS Glue e conectá-lo a um endpoint de desenvolvimento do AWS Glue. Com essa integração, você pode usar blocos de anotação gerenciados do Amazon SageMaker em vez de provisionar e gerenciar seus próprios servidores de blocos de anotação, facilitando e agilizando o início do desenvolvimento de scripts ETL do AWS Glue. Um endpoint de desenvolvimento do AWS Glue é um ambiente do Apache Spark sem servidor que você pode usar para desenvolver, depurar e testar scripts ETL do AWS Glue de forma interativa. Para saber mais, consulte nossa documentação.

Além disso, você pode usar a biblioteca do Spark do Amazon SageMaker em endpoints de desenvolvimento do AWS Glue. Essa biblioteca é uma biblioteca do Apache Spark de código aberto para o Amazon SageMaker. Ela possibilita intercalar as etapas do Apache Spark com as etapas que interagem com o Amazon SageMaker em pipelines de ML do Apache Spark, o que permite treinar modelos com o Apache Spark DataFrames no Amazon SageMaker com algoritmos de ML fornecidos pela Amazon, como clustering K-Means ou XGBoost.

O AWS Glue está disponível nas regiões da AWS Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), UE (Frankfurt), UE (Irlanda), Ásia-Pacífico (Seul), Ásia-Pacífico (Sydney) e Ásia-Pacífico (Tóquio). Para ver a disponibilidade do AWS Glue, consulte a tabela de regiões da AWS.