Publicado: Mar 4, 2022
As opções de inferência sem servidor e inferência assíncrona do Amazon SageMaker agora oferecem suporte ao Amazon SageMaker Python SDK, que abstrai as etapas necessárias para a implantação e, portanto, simplifica o fluxo de trabalho de implantação de modelos. O SageMaker Python SDK é uma biblioteca de código aberto para implantar modelos de machine learning no Amazon SageMaker. Você pode usar qualquer uma das frameworks otimizadas de machine learning, algoritmos primários compatíveis com o SageMaker ou trazer seu próprio modelo para implantação usando o Python SDK.
O SageMaker oferece várias opções de inferência, como tempo real, inferência sem servidor (em versão de demonstração), inferência assíncrona e transformação em lotes, para que você possa escolher a opção que melhor se adapta à sua workload. O SageMaker Python SDK já oferece suporte para inferência em tempo real e transformação em lotes. Agora, com o suporte para inferência sem servidor (em versão de demonstração) e inferência assíncrona, você pode usar os mesmos métodos da API Python SDK em todas as opções de inferência. Agora, você tem a opção de escolher entre o Console de Gerenciamento da AWS, o AWS Boto3 SDK, a AWS CLI e o Python SDK para implantação do modelo.
Você pode invocar um endpoint de inferência assíncrona por meio do Python SDK passando a carga útil em linha com a solicitação. O SDK do SageMaker carregará a carga útil no bucket do S3 e invocará o endpoint em seu nome. O Python SDK também adiciona suporte para verificar periodicamente e retornar o resultado da inferência após a conclusão.
Para começar, leia a documentação do Python SDK para inferência sem servidor e inferência assíncrona.