L'évaluation du modèle Amazon Bedrock est désormais disponible dans la région AWS GovCloud (US, côte ouest)
L'évaluation des modèles sur Amazon Bedrock vous permet d'évaluer, de comparer et de sélectionner les modèles de fondation (FM) les mieux adaptés à votre cas d'utilisation. Amazon Bedrock donne le choix entre évaluation automatique et évaluation humaine. Vous pouvez utiliser la première avec des algorithmes prédéfinis pour les métriques telles que la précision, la robustesse et la toxicité. Si l'évaluation des modèles fournit des jeux de données présélectionnés et intégrés, vous pouvez également apporter les vôtres.
L'interface interactive d'Amazon Bedrock vous guide dans l'évaluation des modèles. Il vous suffit de choisir l’évaluation automatique, de sélectionner le type de tâche et les métriques, et de charger vos jeux de données d'invite. Amazon Bedrock procède ensuite aux évaluations et génère un rapport. Ainsi, vous pouvez facilement comparer les performances des différents modèles en fonction des indicateurs que vous avez sélectionnés avant de choisir celui qui convient à votre cas d'utilisation. En utilisant ce rapport en conjonction avec les métriques relatives au coût et à la latence d’Amazon Bedrock, vous pouvez sélectionner le modèle avec le compromis requis en termes de qualité, de coût et de latence.
L'évaluation des modèles sur Amazon Bedrock est désormais disponible pour tous dans la région AWS GovCloud (US, côte ouest) ainsi que dans de nombreuses régions commerciales.
Pour en savoir plus sur l'évaluation des modèles sur Amazon Bedrock, consultez la page web Expérience de développement dans Amazon Bedrock. Pour commencer, connectez-vous à Amazon Bedrock sur la console de gestion AWS ou utilisez l'API Amazon Bedrock.