Definição de preço do Amazon Elastic Inference

Atualização importante

Agradecemos pelo seu interesse no Amazon Elastic Inference. O Amazon Elastic Inference não está mais disponível para novos clientes. É possível obter melhor performance a um custo menor para suas workloads de inferência de machine learning usando outras opções de aceleração de hardware, como o AWS Inferentia. Se você usa o Amazon Elastic Inference atualmente, considere migrar sua workload para essas alternativas. Para saber mais, acesse a página Infraestrutura do AWS Machine Learning.

Com o Amazon Elastic Inference, você paga apenas pelas horas de acelerador usadas. Não há custos antecipados nem taxas mínimas. As versões das estruturas de aprendizado profundo TensorFlow e Apache MXNet otimizadas para a AWS não são cobradas. Não há cobrança adicional pelos VPC endpoints do AWS PrivateLink para o Amazon Elastic Inference desde que você tenha pelo menos uma instância configurada com um acelerador executado em uma zona de disponibilidade onde há um VPC endpoint provisionado.

Definição de preço do Amazon Elastic Inference para Amazon EC2

Veja a seguir a definição de preço do Amazon Elastic Inference com instâncias do Amazon EC2 e Amazon ECS. Para ver a definição de preço do Amazon Elastic Inference com instâncias do Amazon SageMaker, consulte a seção Implantação de modelo na página de definição de preço do Amazon SageMaker.

Temos duas famílias de aceleradores de inferência elásticos (EIA) com três tipos diferentes em cada. O EIA2 é nosso mais recente tipo de acelerador, com o dobro de memória de GPU dos aceleradores EIA1 equivalentes. É possível anexar o EIA2 a qualquer instância do EC2.

Observação: verifique a disponibilidade regional para as duas famílias de aceleradores, pois pode haver diferenças.

Leste dos EUA
Oeste dos EUA
UE
Ásia-Pacífico

Leste dos EUA

Região Leste dos EUA (Norte da Virgínia)

Tipo de acelerador	Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS)	Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS)	Memória	Definição de preço
eia2.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	2 GB	0,120 USD por hora
eia2.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	4 GB	0,240 USD por hora
eia2.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	8 GB	0,340 USD por hora
eia1.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	1 GB	0,130 USD por hora
eia1.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	2 GB	0,260 USD por hora
eia1.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	4 GB	0,520 USD por hora

Região do Leste dos EUA (Ohio)

Tipo de acelerador	Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS)	Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS)	Memória	Definição de preço
eia2.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	2 GB	0,120 USD por hora
eia2.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	4 GB	0,240 USD por hora
eia2.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	8 GB	0,340 USD por hora
eia1.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	1 GB	0,130 USD por hora
eia1.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	2 GB	0,260 USD por hora
eia1.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	4 GB	0,520 USD por hora

Oeste dos EUA

Região Oeste dos EUA (Oregon)

Tipo de acelerador	Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS)	Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS)	Memória	Definição de preço
eia2.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	2 GB	0,120 USD por hora
eia2.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	4 GB	0,240 USD por hora
eia2.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	8 GB	0,340 USD por hora
eia1.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	1 GB	0,130 USD por hora
eia1.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	2 GB	0,260 USD por hora
eia1.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	4 GB	0,520 USD por hora

UE

Região UE (Irlanda)

Tipo de acelerador	Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS)	Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS)	Memória	Definição de preço
eia2.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	2 GB	0,129 USD por hora
eia2.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	4 GB	0,258 USD por hora
eia2.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	8 GB	0,366 USD por hora
eia1.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	1 GB	0,140 USD por hora
eia1.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	2 GB	0,280 USD por hora
eia1.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	4 GB	0,560 USD por hora

Ásia-Pacífico

Região Ásia-Pacífico (Tóquio)

Tipo de acelerador	Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS)	Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS)	Memória	Definição de preço
eia2.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	2 GB	0,205 USD por hora
eia2.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	4 GB	0,411 USD por hora
eia2.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	8 GB	0,582 USD por hora
eia1.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	1 GB	0,220 USD por hora
eia1.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	2 GB	0,450 USD por hora
eia1.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	4 GB	0,890 USD por hora

Região Ásia-Pacífico (Seul)

Tipo de acelerador	Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS)	Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS)	Memória	Definição de preço
eia2.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	2 GB	0,196 USD por hora
eia2.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	4 GB	0,392 USD por hora
eia2.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	8 GB	0,556 USD por hora
eia1.medium	1 FP-32 TFLOPS	8 FP-16 TFLOPS	1 GB	0,210 USD por hora
eia1.large	2 FP-32 TFLOPS	16 FP-16 TFLOPS	2 GB	0,430 USD por hora
eia1.xlarge	4 FP-32 TFLOPS	32 FP-16 TFLOPS	4 GB	0,850 USD por hora

Exemplo 1 de definição de preço

Vamos supor que você esteja executando um aplicativo de análise de vídeo de streaming. Para executar inferência de aprendizagem profunda a fim de analisar um único stream de vídeo nesse aplicativo, você pode escolher uma instância c5.xlarge do Amazon EC2, configurada com um acelerador eia2.medium do Amazon Elastic Inference. O custo por hora para executar esse modelo de aprendizagem profunda na região Leste dos EUA (Norte da Virgínia) é:

Preço por hora da instância c5.xlarge: 0,17 USD
Preço por hora de um acelerador eia2.medium: 0,12 USD
Preço por hora total da instância configurada com o acelerador: 0,29 USD
Custo mensal total = 0,29 USD * 24 * 31 = 215,76 USD

Exemplo 2 de definição de preço

Vamos supor que você esteja executando um aplicativo web que analisa imagens carregadas em tempo real por usuários finais. Para usar a inferência de aprendizagem profunda para esse aplicativo, você pode escolher uma instância c5.large do Amazon EC2, configurada com um acelerador eia2.medium do Amazon Elastic Inference e escalar a capacidade dessa instância usando o Amazon EC2 Auto Scaling para atender às demandas do aplicativo. O custo por hora para essa combinação na região Leste dos EUA (Norte da Virgínia) é:

Preço por hora da instância c5.large: 0,085 USD
Preço por hora de um acelerador eia2.medium: 0,12 USD
Preço por hora total da instância configurada com o acelerador: 0,205 USD
Custo mensal total = 0,205 USD * 24 * 31 = 152,52 USD