L'évaluation des modèles sur Amazon Bedrock est désormais disponible dans la région Europe (Zurich)
L'évaluation des modèles sur Amazon Bedrock vous permet d'évaluer, de comparer et de sélectionner les modèles de fondation (FM) les mieux adaptés à votre cas d'utilisation. Amazon Bedrock offre la possibilité d'utiliser un LLM en tant que juge, une évaluation programmatique et une évaluation humaine. Vous pouvez utiliser un LLM en tant que juge pour des métriques telles que l'exactitude, l'exhaustivité et la cohérence, ainsi que pour des métriques d'IA responsable telles que le refus de réponse et la nocivité. L'évaluation programmatique propose des algorithmes pour des paramètres tels que la précision, la robustesse et la toxicité. De plus, pour ces métriques, ou des métriques subjectives ou personnalisées, telles que la convivialité ou le style, vous pouvez configurer en quelques clics un flux de travail d'évaluation humaine. L’évaluation humaine repose sur vos propres employés ou une équipe gérée par AWS comme réviseurs. Si l'évaluation des modèles fournit des jeux de données présélectionnés et intégrés, vous pouvez également apporter les vôtres. Désormais, les clients peuvent évaluer des modèles dans la région en Europe (Zurich).
L'évaluation des modèles sur Amazon Bedrock est désormais disponible dans ces régions, et la disponibilité des types d'évaluation varie d'une région à l'autre.
Pour en savoir plus sur l'évaluation des modèles sur Amazon Bedrock, consultez la page Amazon Bedrock Evaluations. Pour commencer, connectez-vous à Amazon Bedrock sur la console de gestion AWS ou utilisez l'API Amazon Bedrock.