AWS Inferentia

Chip de inferência de machine learning de alta performance, projetado especificamente pela AWS

O AWS Inferentia é um chip de inferência de machine learning projetado para fornecer alta performance com economia. O AWS Inferentia oferecerá suporte às estruturas de aprendizado profundo TensorFlow, Apache MXNet e PyTorch, assim como aos modelos que usam o formato ONNX.

A execução de previsões usando um modelo treinado de machine learning (um processo chamado inferência) pode gerar até 90% dos custos de computação do aplicativo. Com o Amazon Elastic Inference, os desenvolvedores podem reduzir os custos de inferência em até 75% associando uma aceleração de inferência baseada em GPU às instâncias do Amazon EC2 e do Amazon SageMaker. No entanto, algumas cargas de trabalho de inferência exigem uma GPU inteira ou latência extremamente baixa. Para resolver esse desafio com economia, é necessário um chip de inferência dedicado.

O AWS Inferentia oferece uma performance de inferência de alto throughput e baixa latência a um custo extremamente baixo. Cada chip fornece throughput de inferência de centenas de TOPS (tera operações por segundo) para permitir que modelos complexos façam previsões rápidas. Para obter uma performance ainda maior, vários chips do AWS Inferentia podem ser usados em conjunto para gerar um throughput de milhares de TOPS. O AWS Inferentia estará disponível para uso com os serviços Amazon SageMaker, Amazon EC2 e Amazon Elastic Inference.

Cadastre-se para receber notificações sobre a disponibilidade do serviço

Para ser notificado sobre a disponibilidade do AWS Inferentia, cadastre-se aqui. Enviaremos um e-mail quando mais informações ficarem disponíveis.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Fique atualizado sobre a disponibilidade do serviço

O AWS Inferentia chegará em breve. Cadastre-se para ser notificado quando mais informações ficarem disponíveis.

Saiba mais 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Comece a criar no console

Comece a usar o machine learning no Console AWS.

Faça login