Amazon-Bedrock-Modellbewertung jetzt in Europa (Zürich) verfügbar
Mit der Modellbewertung in Amazon Bedrock können Sie die besten Basismodelle für Ihren Anwendungsfall evaluieren, vergleichen und auswählen. Amazon Bedrock bietet die Wahl zwischen LLM-as-a-Judge, einer programmatischen Bewertung und einer menschlichen Bewertung. Sie können LLM-as-a-Judge für Kennzahlen wie Korrektheit, Vollständigkeit und Kohärenz sowie für verantwortungsvolle KI-Metriken wie Antwortverweigerung und Schädlichkeit verwenden. Die programmatische Bewertung bietet Algorithmen für Metriken wie Genauigkeit, Robustheit und Toxizität. Für diese Metriken oder für subjektive und benutzerdefinierte Metriken wie Freundlichkeit oder Stil können Sie mit wenigen Klicks einen menschlichen Bewertungsworkflow einrichten. Bei menschlichen Bewertungsworkflows können Ihre eigenen Mitarbeiter oder ein von AWS verwaltetes Team als Prüfer eingesetzt werden. Die Modellbewertung bietet integrierte kuratierte Datensätze. Sie können aber auch Ihre eigenen Datensätze verwenden. Jetzt können Kunden Modelle in Europa (Zürich) bewerten.
Die Modellbewertung auf Amazon Bedrock ist jetzt in diesen Regionen verfügbar, und die Verfügbarkeit der Bewertungstypen variiert je nach Region.
Weitere Informationen zur Modellbewertung auf Amazon Bedrock finden Sie auf der Seite Amazon-Bedrock-Bewertungen. Melden Sie sich zunächst in der AWS-Managementkonsole bei Amazon Bedrock an oder verwenden Sie die Amazon-Bedrock-APIs.