Atualização importante

Agradecemos pelo seu interesse no Amazon Elastic Inference. O Amazon Elastic Inference não está mais disponível para novos clientes. É possível obter melhor performance a um custo menor para suas workloads de inferência de machine learning usando outras opções de aceleração de hardware, como o AWS Inferentia. Se você usa o Amazon Elastic Inference atualmente, considere migrar sua workload para essas alternativas. Para saber mais, acesse a página Infraestrutura do AWS Machine Learning.

Com o Amazon Elastic Inference, você paga apenas pelas horas de acelerador usadas. Não há custos antecipados nem taxas mínimas. As versões das estruturas de aprendizado profundo TensorFlow e Apache MXNet otimizadas para a AWS não são cobradas. Não há cobrança adicional pelos VPC endpoints do AWS PrivateLink para o Amazon Elastic Inference desde que você tenha pelo menos uma instância configurada com um acelerador executado em uma zona de disponibilidade onde há um VPC endpoint provisionado.

Definição de preço do Amazon Elastic Inference para Amazon EC2

Veja a seguir a definição de preço do Amazon Elastic Inference com instâncias do Amazon EC2 e Amazon ECS. Para ver a definição de preço do Amazon Elastic Inference com instâncias do Amazon SageMaker, consulte a seção Implantação de modelo na página de definição de preço do Amazon SageMaker.

Temos duas famílias de aceleradores de inferência elásticos (EIA) com três tipos diferentes em cada. O EIA2 é nosso mais recente tipo de acelerador, com o dobro de memória de GPU dos aceleradores EIA1 equivalentes. É possível anexar o EIA2 a qualquer instância do EC2.

Observação: verifique a disponibilidade regional para as duas famílias de aceleradores, pois pode haver diferenças.

  • Leste dos EUA
  • Região Leste dos EUA (Norte da Virgínia)

    Tipo de acelerador Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS) Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS) Memória Definição de preço
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2 GB 0,120 USD por hora
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4 GB 0,240 USD por hora
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8 GB 0,340 USD por hora
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1 GB 0,130 USD por hora
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2 GB 0,260 USD por hora
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4 GB 0,520 USD por hora

    Região do Leste dos EUA (Ohio)

    Tipo de acelerador Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS) Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS) Memória Definição de preço
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2 GB 0,120 USD por hora
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4 GB 0,240 USD por hora
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8 GB 0,340 USD por hora
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1 GB 0,130 USD por hora
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2 GB 0,260 USD por hora
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4 GB 0,520 USD por hora
  • Oeste dos EUA
  • Região Oeste dos EUA (Oregon)

    Tipo de acelerador Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS) Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS) Memória Definição de preço
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2 GB 0,120 USD por hora
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4 GB 0,240 USD por hora
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8 GB 0,340 USD por hora
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1 GB 0,130 USD por hora
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2 GB 0,260 USD por hora
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4 GB 0,520 USD por hora
  • UE
  • Região UE (Irlanda)

    Tipo de acelerador Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS) Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS) Memória Definição de preço
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2 GB 0,129 USD por hora
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4 GB 0,258 USD por hora
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8 GB 0,366 USD por hora
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1 GB 0,140 USD por hora
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2 GB 0,280 USD por hora
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4 GB 0,560 USD por hora
  • Ásia-Pacífico
  • Região Ásia-Pacífico (Tóquio)

    Tipo de acelerador Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS) Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS) Memória Definição de preço
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2 GB 0,205 USD por hora
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4 GB 0,411 USD por hora
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8 GB 0,582 USD por hora
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1 GB 0,220 USD por hora
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2 GB 0,450 USD por hora
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4 GB 0,890 USD por hora

    Região Ásia-Pacífico (Seul)

    Tipo de acelerador Throughput em trilhões de operações de ponto flutuante de 32 bits por segundo (FP-32 TFLOPS) Throughput em trilhões de operações de ponto flutuante de 16 bits por segundo (FP-16 TFLOPS) Memória Definição de preço
    eia2.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 2 GB 0,196 USD por hora
    eia2.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 4 GB 0,392 USD por hora
    eia2.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 8 GB 0,556 USD por hora
    eia1.medium 1 FP-32 TFLOPS 8 FP-16 TFLOPS 1 GB 0,210 USD por hora
    eia1.large 2 FP-32 TFLOPS 16 FP-16 TFLOPS 2 GB 0,430 USD por hora
    eia1.xlarge 4 FP-32 TFLOPS 32 FP-16 TFLOPS 4 GB 0,850 USD por hora

Exemplo 1 de definição de preço

Vamos supor que você esteja executando um aplicativo de análise de vídeo de streaming. Para executar inferência de aprendizagem profunda a fim de analisar um único stream de vídeo nesse aplicativo, você pode escolher uma instância c5.xlarge do Amazon EC2, configurada com um acelerador eia2.medium do Amazon Elastic Inference. O custo por hora para executar esse modelo de aprendizagem profunda na região Leste dos EUA (Norte da Virgínia) é:

Preço por hora da instância c5.xlarge: 0,17 USD
Preço por hora de um acelerador eia2.medium: 0,12 USD
Preço por hora total da instância configurada com o acelerador: 0,29 USD
Custo mensal total = 0,29 USD * 24 * 31 = 215,76 USD

Exemplo 2 de definição de preço

Vamos supor que você esteja executando um aplicativo web que analisa imagens carregadas em tempo real por usuários finais. Para usar a inferência de aprendizagem profunda para esse aplicativo, você pode escolher uma instância c5.large do Amazon EC2, configurada com um acelerador eia2.medium do Amazon Elastic Inference e escalar a capacidade dessa instância usando o Amazon EC2 Auto Scaling para atender às demandas do aplicativo. O custo por hora para essa combinação na região Leste dos EUA (Norte da Virgínia) é:

Preço por hora da instância c5.large: 0,085 USD
Preço por hora de um acelerador eia2.medium: 0,12 USD
Preço por hora total da instância configurada com o acelerador: 0,205 USD
Custo mensal total = 0,205 USD * 24 * 31 = 152,52 USD

Recursos adicionais de preço

Calculadora de preços da AWS

Calcule facilmente os custos mensais na AWS

Obtenha assistência de preços

Entre em contato com os especialistas da AWS para obter um orçamento personalizado

Saiba como começar a usar

Saiba mais nos tutoriais e na documentação.

Saiba mais 
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Comece a criar no console

Comece a usar o Amazon Elastic Inference no Amazon SageMaker ou no Amazon EC2.

Faça login