Publicado: Apr 17, 2024
Agora, os cadernos JupyterLab do Amazon SageMaker Studio vêm com uma extensão SQL integrada que pode ser usada facilmente por cientistas de dados para descobrir, explorar e transformar dados de várias fontes de dados usando SQL e Python diretamente dos cadernos.
Cientistas de dados que trabalham em cadernos do Studio já podem se conectar de forma integrada a serviços de dados populares, incluindo Amazon Athena, Amazon Redshift e Snowflake, por meio de conexões do AWS Glue. Os administradores podem gerenciar essas conexões de forma segura para que os cientistas de dados possam acessar dados autorizados sem a necessidade de gerenciar credenciais manualmente. Uma vez conectados a uma fonte de dados, os cientistas de dados podem navegar e pesquisar com facilidade bancos de dados, esquemas, tabelas e visualizações, além de visualizar dados na interface do caderno. Em seguida, eles podem combinar código SQL e Python no mesmo caderno para explorar e transformar com eficiência dados para uso em projetos de machine learning. Recursos adicionais, como preenchimento de comandos SQL, assistência à formatação de código e destaque de sintaxe, ajudam a acelerar o desenvolvimento de código e melhorar a produtividade geral do desenvolvedor. Ao integrar serviços de dados populares, exploração de dados SQL/Python e machine learning de ponta a ponta em uma interface de usuário unificada, o SageMaker Studio reduz a necessidade de cientistas de dados alternarem entre ferramentas enquanto trabalham em tarefas de análise e machine learning, resultando em significativa economia de tempo e aumento da produtividade.
Esse recurso está disponível em todas as regiões comerciais da AWS que oferecem o SageMaker.
Para saber mais, consulte este blog e o Guia do desenvolvedor do SageMaker.