O Amazon SageMaker oferece uma seleção de tipos de instâncias otimizadas, adequadas a diferentes casos de uso de Machine Learning. Os tipos de instâncias consistem em várias combinações de CPU, GPU, memória, armazenamento e capacidade de rede e oferecem flexibilidade de escolha da composição adequada de recursos para criar, treinar e implantar modelos de Machine Learning. Cada tipo de instância inclui um ou mais tamanhos de instância, permitindo a escalabilidade de seus recursos de acordo com os requisitos da carga de trabalho a ser executada. 

Tipo de instância

vCPU GPU Mem (GiB) Mem GPU (GiB)

Performance de rede

Padrão – Geração atual

         

ml.t2.medium

2 4 –   Baixa a moderada
ml.t2.large 2   8   Baixa a moderada
ml.t2.xlarge 4   16   Moderada
ml.t2.2xlarge 8   32   Moderada
ml.t3.medium 2   4   Baixa a moderada
ml.t3.large 2   8
  Baixa a moderada
ml.t3.xlarge 4   16   Baixa a moderada
ml.t3.2xlarge 8   32   Baixa a moderada
ml.m5.large 2   8   Alta
ml.m5.xlarge 4   16   Alta
ml.m5.2xlarge 8   32   Alta
ml.m5.4xlarge 16   64
  Alta
ml.m5.12xlarge 48   192   10 Gigabit
ml.m5.24xlarge 96   384   25 Gigabit

ml.m4.xlarge

4 16 –   Alta
ml.m4.4xlarge 16 64
Alta
ml.m4.10xlarge 40 160 – 
10 Gigabit
ml.m4.16xlarge 64   256   25 Gigabit
           
Memória otimizada – geração atual
         
ml.r5.large 2 16 Até 10 Gbps
ml.r5.xlarge 4 32 Até 10 Gbps
ml.r5.2xlarge 8 64
Até 10 Gbps
ml.r5.4xlarge 16 128 Até 10 Gbps
ml.r5.12xlarge 48 384 10 Gbps
ml.r5.24xlarge 96 768 25 Gbps
           
'Otimizadas para computação – Geração atual'          
ml.c5.large 2   4   Até 10 Gbps
ml.c5.xlarge 4 8 Até 10 Gbps
ml.c5.2xlarge 8 16 Até 10 Gbps
ml.c5.4xlarge 16 32 Até 10 Gbps
ml.c5.9xlarge 36 72 10 Gigabit
ml.c5.18xlarge 72 144 25 Gigabit
ml.c5d.xlarge 4   8   Até 10 Gbps
ml.c5d.2xlarge 8   16   Até 10 Gbps
ml.c5d.4xlarge 16   32   Até 10 Gbps
ml.c5d.9xlarge 36   72   10 Gbps
ml.c5d.18xlarge 72   144   25 Gbps
ml.c4.large 2   3,75   Moderada
ml.c4.xlarge 4 7,5 Alta
ml.c4.2xlarge 8 15 Alta
ml.c4.4xlarge 16   30   Alta
ml.c4.8xlarge 36 60 10 Gigabit
       
Computação acelerada – Geração atual          
ml.p3.2xlarge 8 1xV100 61 16 Até 10 Gbps
ml.p3.8xlarge 32 4xV100 244 64 10 Gigabit
ml.p3.16xlarge 64 8xV100 488 128 25 Gigabit
ml.p3dn.24xlarge 96 8xV100 768 256 100 Gigabit
ml.p2.xlarge 4 1xK80 61 12 Alta
ml.p2.8xlarge 32 8xK80 488
96 10 Gigabit
ml.p2.16xlarge 64 16xK80 732 192 25 Gigabit
ml.g4dn.xlarge 4 1xT4 16 16 Até 25 Gbps
ml.g4dn.2xlarge 8 1xT4 32 16 Até 25 Gbps
ml.g4dn.4xlarge 16 1xT4 64 16 Até 25 Gbps
ml.g4dn.8xlarge 32 1xT4 128 16 50 Gbps
ml.g4dn.12xlarge 48 4xT4 192 64 50 Gbps
ml.g4dn.16xlarge 64 1xT4 256 16 50 Gbps
Aceleração de inferência
Aceleradora Taxa de transferência em FP-32 TFLOPS*
Taxa de transferência em FP-16 TFLOPS** Memória
eia1.medium 1 8 1 GB
eia1.large 2 16 2 GB
eia1.xlarge 4
32 4 GB

* FP-32 TFLOPS = trilhões de operações flutuantes de 32 bits por segundo

** FP-16 TFLOPS = trilhões de operações flutuantes de 16 bits por segundo

Saiba mais sobre a definição de preço do Amazon SageMaker

Acesse a página de definição de preço
Pronto para começar?
Cadastrar-se
Tem outras dúvidas?
Entre em contato conosco