Amazon Bedrock AgentCore lance des fonctionnalités d’optimisation des performances des agents en version préliminaire
Amazon Bedrock AgentCore propose des recommandations et deux méthodes pour valider les performances (évaluations par lots et tests A/B). Ceci complète la boucle d’observation, d’évaluation et d’amélioration pour les agents d’IA en production. Jusqu’à présent, la traduction des résultats de l’évaluation en améliorations concrètes et validées nécessitait l’intervention manuelle des développeurs et leur intuition plutôt qu’une approche systématique. Grâce aux recommandations, aux évaluations par lots et aux tests A/B, les développeurs disposent désormais des outils nécessaires pour agir en fonction des évaluations qui apparaissent.
À mesure que les modèles évoluent et que le comportement des utilisateurs change, la qualité des agents se dégrade progressivement au fil du temps. La fonctionnalité de recommandations analyse les traces de production et les résultats d’évaluation générés par AgentCore afin de créer des instructions système optimisées et des descriptions d’outils adaptées à votre charge de travail spécifique. Les évaluations par lots sont ensuite utilisées pour valider les recommandations par rapport à des cas de test prédéfinis. Les tests A/B permettent de valider davantage ces recommandations par le biais de tests A/B contrôlés par rapport à des ensembles de tests prédéfinis ou à un trafic de production en direct, la signification statistique étant signalée avant la promotion de tout changement. Chaque recommandation nécessite votre approbation avant d’être expédiée. Ensemble, ces fonctionnalités complètent le cycle d’amélioration des performances des agents. Les agents ne se contentent pas d’exécuter, ils s’améliorent selon vos conditions.
Vous pouvez utiliser les fonctionnalités d’optimisation dans toutes les Régions AWS où les évaluations AgentCore sont disponibles. Pour en savoir plus, consultez la documentation relative à AgentCore.