Annonce de l'inférence optimisée en termes de latence pour le modèle de base Amazon Nova Pro dans Amazon Bedrock

Publié le: 5 mars 2025

Le modèle de base d'Amazon Nova Pro prend désormais en charge l'inférence optimisée pour la latence en version préliminaire sur Amazon Bedrock, ce qui permet d'accélérer les temps de réponse et d'améliorer la réactivité des applications d'IA générative. L'inférence optimisée pour la latence accélère les temps de réponse pour les applications sensibles à la latence, améliorant ainsi l'expérience de l'utilisateur final et offrant aux développeurs plus de flexibilité pour optimiser les performances en fonction de leur cas d'utilisation. L’accès à ces fonctionnalités ne nécessite aucune configuration supplémentaire ni aucun ajustement du modèle, ce qui permet d’améliorer immédiatement les applications existantes avec des temps de réponse plus rapides.

L'inférence optimisée en termes de latence pour Amazon Nova Pro est disponible par inférence interrégionale dans les régions USA Ouest (Oregon), USA Est (Virginie) et USA Est (Ohio). Pour en savoir plus sur les modèles de fondation Amazon Nova, consultez le blog d’actualités AWS, la page produit d’Amazon Nova ou le Guide de l'utilisateur d’Amazon Nova. Pour en savoir plus sur l'inférence optimisée en termes de latence sur Bedrock, consultez la documentation. Vous pouvez commencer à utiliser les modèles de fondation Amazon Nova dans Amazon Bedrock depuis la console Amazon Bedrock.