Ankündigung latenzoptimierter Inferenz für das Amazon-Nova-Pro-Basismodell in Amazon Bedrock
Das Amazon-Nova-Pro-Basismodell unterstützt jetzt latenzoptimierte Inferenz in der Vorschauversion auf Amazon Bedrock, was schnellere Reaktionszeiten und eine verbesserte Reaktionsfähigkeit für generative KI-Anwendungen ermöglicht. Latenzoptimierte Inferenz beschleunigt die Reaktionszeiten für latenzempfindliche Anwendungen, verbessert das Endbenutzererlebnis und gibt Entwicklern mehr Flexibilität, um die Leistung für ihren Anwendungsfall zu optimieren. Der Zugriff auf diese Funktionen bedarf keiner zusätzlichen Konfiguration oder einer Feinabstimmung des Modells, was eine umgehende Erweiterung bestehender Anwendungen mit schnelleren Reaktionszeiten erlaubt.
Latenzoptimierte Inferenz für Amazon Nova Pro ist über regionsübergreifende Inferenz in den Regionen USA West (Oregon), USA Ost (Virginia) und USA Ost (Ohio) verfügbar. Weitere Informationen zu Amazon-Nova-Basismodellen finden Sie im AWS News Blog, auf der Amazon-Nova-Produktseite oder im Amazon-Nova-Benutzerhandbuch. Weitere Informationen zur latenzoptimierten Inferenz auf Bedrock finden Sie in der Dokumentation. Sie können von der Amazon-Bedrock-Konsole aus mit Amazon-Nova-Basismodellen in Amazon Bedrock beginnen.