AWS Inferentia

Hochleistungsfähiger Inferenzchip für Machine Learning, eigens von AWS entwickelt.

AWS Inferentia ist ein Inferenzchip für Machine Learning, der entwickelt wurde, um hohe Leistung zu niedrigen Kosten zu liefern. AWS Inferentia unterstützt die Deep Learning Frameworks von TensorFlow, Apache MXNet und PyTorch sowie Modelle, die das ONNX-Format nutzen.

Prognosen können mithilfe eines trainierten Machine-Learning-Modells – ein Prozess, der als Inferenz bezeichnet wird – die Datenverarbeitungskosten der Anwendung um bis zu 90 % senken. Mit Amazon Elastic Inference können Entwickler die Inferenzkosten um bis zu 75 % senken, indem sie GPU-basierte Inferenzbeschleunigung mit Amazon EC2- und Amazon SageMaker-Instances nutzen. Einige Inferenz-Workloads erfordern jedoch eine eigenständige GPU oder erfordern eine extrem niedrige Latenz. Um diese Herausforderung zu lösen und dabei die Kosten niedrig zu halten, mussten wir einen eigens dafür vorgesehenen Inferenzchip entwickeln.

AWS Inferentia bietet eine Inferenzleistung mit hohem Durchsatz und niedriger Latenz bei extrem niedrigen Kosten. Jeder Chip bietet Hunderte von TOPS (tera operations per second) an Interferenzdurchsatz und ermöglicht komplexen Modellen damit schnelle Prognosen. Für noch mehr Leistung lassen sich AWS Inferentia-Chips auch gemeinsam nutzen, was Tausende TOPS an Durchsatz ermöglicht. AWS Inferentia ist für den Einsatz mit Amazon SageMaker, Amazon EC2 und Amazon Elastic Inference verfügbar.

Benachrichtigungen zur Verfügbarkeit des Services abonnieren

Um über die Verfügbarkeit von AWS Inferentia informiert zu werden, registrieren Sie sich hier, und wir senden Ihnen eine E-Mail, sobald weitere Informationen verfügbar sind.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Updates zur Verfügbarkeit des Services erhalten

AWS Inferentia ist schon bald erhältlich. Registrieren Sie sich, um benachrichtigt zu werden, wenn weitere Informationen verfügbar sind.

Weitere Informationen 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Entwicklung in der Konsole – Erste Schritte

Lernen Sie mehr über Machine Learning in der AWS-Konsole.

Anmeldung