Anunciamos la inferencia optimizada para la latencia para el modelo fundacional de Amazon Nova Pro en Amazon Bedrock

Publicado en: 5 de mar de 2025

El modelo fundacional de Amazon Nova Pro ahora admite la inferencia optimizada para la latencia en versión preliminar en Amazon Bedrock, lo que habilita tiempos de respuesta más rápidos y una mejor capacidad de respuesta para las aplicaciones de IA generativa. La inferencia optimizada para la latencia acelera los tiempos de respuesta de las aplicaciones sensibles a la latencia. De este modo, se mejora la experiencia del usuario final y se brinda a los desarrolladores más flexibilidad para optimizar el rendimiento para su caso de uso. El acceso a estas capacidades no requiere ninguna configuración adicional ni ajuste del modelo, lo que permite la mejora inmediata de las aplicaciones existentes con tiempos de respuesta más rápidos.

La inferencia optimizada para la latencia para Amazon Nova Pro está disponible mediante inferencia interregional en las regiones Oeste de EE. UU. (Oregón), Este de EE. UU. (Virginia), y Este de EE. UU. (Ohio). Obtenga más información sobre los modelos fundacionales de Amazon Nova en el blog AWS News, la página del producto Amazon Nova o la guía del usuario de Amazon Nova. Obtenga más información sobre la inferencia optimizada para la latencia en Bedrock en la documentación. Puede empezar a utilizar los modelos fundacionales de Amazon Nova en Amazon Bedrock desde la consola de Amazon Bedrock.