Publicado: Nov 7, 2019

O Data Science Software Development Kit (SDK) do AWS Step Functions é uma biblioteca de código-fonte aberto que permite criar facilmente fluxos de trabalho que pré-processam dados e, em seguida, treinam e publicam modelos de machine learning usando o Amazon SageMaker e o AWS Step Functions. Você pode criar fluxos de trabalho de machine learning em Python que orquestram a infraestrutura da AWS em grande escala, sem precisar provisionar e integrar os serviços da AWS separadamente.

O AWS Step Functions é um serviço de orquestração sem servidor que permite criar fluxos de trabalho resilientes usando serviços da AWS, como o Amazon SageMaker, o AWS Glue e o AWS Lambda. O Amazon SageMaker permite criar, treinar e implantar modelos de machine learning rapidamente. Agora, com o novo Data Science SDK, você pode facilmente construir fluxos de trabalho, também conhecidos como pipelines, na infraestrutura da AWS usando as ferramentas preferidas dos cientistas de dados: o Python e o Jupyter Notebooks.

Você pode usar o Data Science SDK para criar e visualizar fluxos de trabalho de ciência de dados de ponta a ponta que executam tarefas como pré-processamento de dados no AWS Glue e treinamento de modelos, ajuste de hiperparâmetros e criação de endpoints no Amazon Sagemaker. Você pode reutilizar os fluxos de trabalho em produção exportando modelos do AWS CloudFormation.

O Data Science SDK está incluído na definição de preço do AWS Step Functions sem custos adicionais e está disponível em todas as regiões em que o AWS Step Functions e o Amazon SageMaker são oferecidos. O SDK pode ser usado em conjunto com outros serviços, como o AWS Glue e o AWS Lambda, em suas regiões com suporte. Para obter uma lista completa de regiões e ofertas de serviço, consulte Regiões da AWS.

Para começar com o Data Science SDK do AWS Step Functions, faça download do notebook Hello World no GitHub ou abra-o em uma instância de notebook no Amazon SageMaker.  

Para saber mais: