Instâncias de caderno do Amazon SageMaker já oferecem suporte a instâncias baseadas em Trainium1 e Inferentia 2
Temos o prazer de anunciar a disponibilidade geral das instâncias do EC2 baseadas em Trainium1 e Inferentia2 nas instâncias de caderno do SageMaker.
As instâncias Trn1 do Amazon EC2, acionadas por chips AWS Trainium, e as instâncias Inf2, acionadas por chips AWS Inferentia, foram criadas especificamente para treinamento e inferência de aprendizado profundo de alta performance, respectivamente. As instâncias Trn1 oferecem economia de custos em relação a outras instâncias comparáveis do Amazon EC2 para treinar mais de 100 bilhões de modelos de IA generativa de parâmetros, como grandes modelos de linguagem (LLMs) e difusão latente. As instâncias Inf2 oferecem inferência de baixo custo e alta performance para IA generativa, incluindo LLMs e transformadores de visão. Você pode usar as instâncias Trn1 e Inf2 em um amplo conjunto de aplicações, como resumo de texto, geração de código, resposta a perguntas, geração de imagens e vídeos, recomendação e detecção de fraudes.
As instâncias Trn1 do Amazon EC2 estão disponíveis para instâncias de caderno do SageMaker nas regiões da AWS Leste dos EUA (N. da Virgínia e Ohio) e Oeste dos EUA (Oregon). As instâncias Trn1n do Amazon EC2 estão disponíveis para instâncias de caderno do SageMaker nas regiões da AWS Leste dos EUA (N. da Virgínia e Ohio). As instâncias Inf2 do Amazon EC2 estão disponíveis para instâncias de caderno do SageMaker nas regiões da AWS Oeste dos EUA (Oregon), Leste dos EUA (N. da Virgínia e Ohio), Europa (Irlanda), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Sydney), Ásia-Pacífico (Mumbai), Europa (Londres), Ásia-Pacífico (Singapura), Europa (Estocolmo), Europa (Paris) e América do Sul (São Paulo).
Acesse o guia do desenvolvedor para obter instruções sobre como configurar e usar as instâncias de caderno do SageMaker.