L’évaluation des modèles sur Amazon Bedrock prend désormais en charge l'évaluation de modèles personnalisés et importés

Publié le: 18 oct. 2024

L'évaluation des modèles sur Amazon Bedrock vous permet d'évaluer, de comparer et de sélectionner les modèles de fondation (FM) les mieux adaptés à votre cas d'utilisation. Amazon Bedrock donne le choix entre évaluation automatique et évaluation humaine. Vous pouvez utiliser la première avec des algorithmes prédéfinis pour les métriques telles que la précision, la robustesse et la toxicité. De plus, pour ces métriques, ou des métriques subjectives ou personnalisées (convivialité, style ou encore adéquation avec la voix de la marque), configurez en quelques clics un flux de travail d'évaluation humaine. Vos propres employés ou une équipe gérée par AWS seront sollicités comme réviseurs. Si l'évaluation des modèles fournit des jeux de données présélectionnés et intégrés, vous pouvez également apporter les vôtres.

Désormais, les clients peuvent évaluer leurs propres modèles qu'ils ont importés sur Amazon Bedrock grâce à la fonctionnalité d'importation de modèles personnalisés. Cela permet aux clients de terminer le cycle de sélection d'un modèle de fondation, de le personnaliser, de l'évaluer et de le personnaliser à nouveau si nécessaire, ou de poursuivre la production s'ils sont satisfaits des résultats de son évaluation. Pour évaluer un modèle importé, sélectionnez simplement le modèle personnalisé dans la liste des modèles à évaluer dans l'outil de sélection de modèles lors de la création d'une tâche d'évaluation.

L'évaluation des modèles sur Amazon Bedrock est désormais disponible pour tous ces régions commerciales ainsi que dans la région AWS GovCloud (US, côte ouest).

Pour en savoir plus sur l'évaluation des modèles sur Amazon Bedrock, consultez la page web Expérience de développement dans Amazon Bedrock. Pour commencer, connectez-vous à Amazon Bedrock sur la console de gestion AWS ou utilisez l'API Amazon Bedrock.