Publicado: Oct 25, 2022
O Amazon SageMaker amplia o acesso a oito novas famílias de instâncias de machine learning (ML) baseadas em processadores Graviton2 e Graviton3, oferecendo aos clientes mais opções de otimização de custo e performance na implantação de modelos de ML no SageMaker. Agora, os clientes podem usar instâncias ml.c7g, ml.m6g, ml.m6gd, ml.c6g, ml.c6gd, ml.c6gn, ml.r6g e ml.r6gd para as opções de implantação de modelos de inferência em tempo real e assíncrona.
Agora, o Amazon SageMaker oferece suporte a sete famílias de instâncias: ml.m6g, ml.m6gd, ml.c6g, ml.c6gd, ml.c6gn, ml.r6g e ml.r6gd. Essas famílias são baseadas em processadores AWS Graviton2, que oferecem uma performance até 40% superior para uma grande variedade de workloads e custam o mesmo que as instâncias comparáveis de quinta geração, baseadas em x86. As instâncias de ML baseadas em Graviton2 estão disponíveis em todas as regiões comerciais. Para saber quais famílias de instâncias estão disponíveis em uma região, consulte a página de preços.
As instâncias baseadas em Graviton3 usam os aprimoramentos do Graviton2 para oferecer performance até 25% superior, performance de ponto flutuante até duas vezes maior e acesso a memória 50% mais rápido (usando tecnologia de memória DDR5 de última geração) em comparação aos processadores Graviton2. Especificamente para workloads de ML, os processadores AWS Graviton3 oferecem performance até três vezes melhor em comparação com os processadores AWS Graviton2, incluindo o suporte a bfloat16. Agora, o Amazon SageMaker oferece suporte à família de instâncias ml.c7g. Essas instâncias estão disponíveis nas regiões Leste dos EUA (Ohio), Leste dos EUA (N. da Virgínia), Oeste dos EUA (Oregon) e Europa (Irlanda).
Para começar a usar, selecione uma instância baseada em Graviton durante a criação da configuração de endpoint do SageMaker. Para obter informações sobre os preços dessas instâncias, acesse a página de preços.