Publicado: Apr 4, 2024

Temos o prazer de anunciar a disponibilidade geral das instâncias P5, C6i, C7i, M6i, M7i, R6i e R7i do Amazon EC2 nos cadernos do SageMaker.

As instâncias M7i, R7i e C7i do Amazon EC2 são alimentadas por processadores Intel Xeon Scalable personalizados de 4ª geração e oferecem performance de preço até 15% melhor em comparação com suas instâncias da geração anterior (M6i, R6i e C6i). As instâncias M6i, R6i e C6i são baseadas em processadores Intel Xeon Escaláveis de 3ª geração. Você pode usar os tipos de instância M, R e C para workloads de Machine Learning (ML) baseadas em CPU e com uso intensivo de computação.

As instâncias P5 oferecem até oito das mais recentes GPUs NVIDIA H100 Tensor Core. As instâncias P5 complementam as GPUs NVIDIA H100 Tensor Core com performance de CPU duas vezes maior, memória de sistema duas vezes maior e armazenamento local quatro vezes maior em comparação com as instâncias baseadas em GPU da geração anterior. Você pode usar as instâncias P5 para treinar modelos interativos para grandes modelos de linguagem (LLMs) e modelos de difusão cada vez mais complexos, que potencializam as aplicações de inteligência artificial (IA) generativa mais exigentes. Essas aplicações incluem respostas a perguntas, geração de código, geração de vídeo e imagem e reconhecimento de fala.

Acesse os guias do desenvolvedor para obter instruções sobre como configurar e usar as aplicações JupyterLab e CodeEditor no SageMaker Studio e nas instâncias do caderno do SageMaker. Para obter informações sobre preços e disponibilidade regional dessas instâncias, acesse nossa página de preços.