Inferência do Amazon SageMaker agora oferece suporte a atualizações contínuas para endpoints de componentes de inferência
Agora, a Inferência do Amazon SageMaker oferece suporte a atualizações contínuas para endpoints de componentes de inferência (IC). Isso permite que os clientes atualizem os endpoints de IC em execução sem interrupção do tráfego, usando o mínimo de instâncias extras, em vez de exigir instâncias duplas, como no passado. A Inferência do SageMaker facilita a implantação de modelos de machine learning, incluindo modelos de base (FMs). Como um recurso da Inferência do SageMaker, o IC permite que os clientes implantem vários FMs no mesmo endpoint e controlem a alocação do acelerador para cada modelo.
Agora, as atualizações contínuas permitem que os clientes atualizem os ICs em um endpoint lote por lote, em vez de todos de uma vez, como no método anterior de atualização azul/verde. As atualizações azuis/verdes exigiam o provisionamento de uma nova frota de ICs com o modelo atualizado antes de transferir o tráfego da frota antiga para a nova, dobrando efetivamente o número de instâncias necessárias. Com as atualizações contínuas, novos ICs são criados em lotes menores, reduzindo significativamente o número de instâncias adicionais necessárias durante as atualizações. Isso ajuda os clientes a minimizar os custos de capacidade extra e a manter requisitos menores de buffer em suas reservas de capacidade.
A atualização contínua do IC está disponível em todas as regiões nas quais o IC tem suporte: Ásia-Pacífico (Tóquio, Seul, Mumbai, Singapura, Sydney, Jacarta), Canadá (Central), Europa (Frankfurt, Estocolmo, Irlanda, Londres), Oriente Médio (Emirados Árabes Unidos), América do Sul (São Paulo), Leste dos EUA (Norte da Virgínia, Ohio) e Oeste dos EUA (N. da Califórnia, Oregon). Para saber mais, consulte a documentação.