Publicado: Nov 24, 2021

O EMR Studio é um ambiente de desenvolvimento integrado (IDE) que torna fácil para os cientistas e engenheiros de dados desenvolverem, visualizarem e depurarem aplicações de análises e Big data escritas em R, Python, Scala e PySpark. Hoje, estamos empolgados para anunciar duas novas funcionalidades em EMR Studio. Primeiro, agora você pode facilmente executar python scripts diretamente do EMR Studio Notebooks. Segundo, você pode executar outros notebooks Jupyter dependentes diretamente de um notebook no EMR Studio. Anteriormente, ambas essas funcionalidades requeriam copiar manualmente esses arquivos do EMR Studio para o EMR Cluster. 

Um EMR Studio Workspace fornece uma instância Jupyter sem servidor totalmente gerenciada na nuvem, que vem com um sistema de arquivo local que você pode criar, armazenar e organizar seus notebooks e arquivos. Cientistas de dados muitas vezes têm Python Scripts e notebooks que precisam ser invocados de outros notebooks. Por exemplo, um Python Script fazendo a verificação de qualidade de dados genéricos, pode ser usado em vários notebooks. Anteriormente, você precisaria copiar manualmente esses arquivos da área do armazenamento local do EMR Studio Workspace para o Cluster para poder executá-los. Agora você pode usar %mount_workspace_dir o comando mágico Jupyter para montar seu diretório EMR Studio Workspace para um EMR Cluster. Isso permite que notebooks em funcionamento no EMR Clusters possam executar arquivos ou invocar outros notebooks no seu Workspace local sem copiar manualmente esses arquivos ou logar no Cluster. Além disso, nós também adicionamos o comando %generate_s3_download_url para baixar arquivo do Amazon S3. Você pode usar essa funcionalidade de baixar um arquivo de dados de um notebook para analisá-lo localmente. ex: para analisá-lo mais detalhadamente em Excel. Sem essa funcionalidade, você teria que navegar até o console Amazon S3 para baixar os arquivos para o seu bucket do S3. Ambos os comandos mágicos Jupyter acima estão disponíveis no pacoteEMR Notebooks iPython Magics.

O EMR Studio está disponível nas seguintes regiões: Leste dos EUA (Ohio), Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Canadá (Central), Europa (Irlanda), Europa (Frankfurt), Europa (Londres),Europa (Paris), Europa (Estocolmo), Ásia-Pacífico (Mumbai), Ásia-Pacífico (Seul), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio) e América do Sul (São Paulo).

Saiba mais sobre esse recurso, consulte nossa documentaçãoaqui. Saiba mais sobre esse recurso, veja nossa amostra notebook aqui.