Publicado: Jun 23, 2023
O Amazon SageMaker Inference Recommender é um recurso do Amazon SageMaker que reduz o tempo necessário para implantar modelos de machine learning (ML) em produção, automatizando testes de carga e ajuste de modelos em instâncias de ML do SageMaker. Hoje, o SageMaker Inference Recommender está anunciando dois recursos importantes. O primeiro permite usar o Inference Recommender no Console da AWS do SageMaker. No segundo, o Inference Recommender oferece recomendações sobre instâncias com potencial para implantação de um modelo quando ele é criado.
Os clientes já podem ver a lista potencial de instâncias para implantação de modelos durante o fluxo de trabalho de criação de modelos. Para personalizar as recomendações fornecidas durante a criação do modelo a fim de otimizar custo ou performance, os usuários podem executar trabalhos de testes comparativos ou de carga usando cargas úteis de entrada personalizadas. Os usuários podem visualizar a lista de instâncias recomendadas de forma programática usando a API DescribeModel ou a interface do usuário do console do SageMaker.
Além disso, os clientes já podem acessar o SageMaker Inference Recommender no Console da AWS. Anteriormente, os clientes só podiam executar trabalhos do Inference Recommender usando o AWS SDK, a AWS CLI ou o SageMaker Studio. Os clientes que preferiam o Console da AWS precisavam navegar entre o SDK, o Studio e o Console da AWS para obter recomendações. Os clientes que usavam exclusivamente o Console da AWS não obtinham nenhum benefício. Com este lançamento, os usuários do Console da AWS já podem executar trabalhos do Inference Recommender no console para obter uma lista potencial de tipos de instância e executar trabalhos de testes comparativos para obter recomendações com custo e performance otimizados.
Para saber mais sobre os lançamentos, consulte a documentação aqui e aqui. Para começar a usar, faça login no console do Amazon SageMaker.