Amazon Bedrock Guardrails annonce des niveaux pour les filtres de contenu et les sujets refusés

Publié le: 24 juin 2025

Amazon Bedrock Guardrails annonce des niveaux pour les filtres de contenu et les sujets refusés, offrant ainsi une flexibilité et une facilité d'utilisation supplémentaires dans le choix des fonctionnalités et une prise en charge linguistique étendue en fonction des cas d'utilisation des clients. Avec un nouveau niveau Standard, Guardrails détecte et filtre désormais les contenus indésirables grâce à une meilleure compréhension du contexte, y compris des modifications telles que les erreurs typographiques, et prend en charge jusqu'à 60 langues.

Bedrock Guardrails propose des barrières de protection configurables pour aider à détecter et bloquer les contenus néfastes et les attaques par invite, définir des rubriques à refuser et interdire des rubriques spécifiques. L’outil supprime également les données d’identification personnelle (PII) telles que les données personnelles provenant des invites de saisie et des modèles de réponses. De plus, Bedrock Guardrails aide à détecter et bloquer les hallucinations des modèles, ainsi qu’à identifier, corriger et expliquer les affirmations factuelles contenues dans les réponses des modèles à l'aide de vérifications du raisonnement automatisé. Les barrières de protection peuvent être appliqués à tous les modèles de base, y compris ceux hébergés par Amazon Bedrock, les modèles auto-hébergés et les modèles tiers en dehors de Bedrock à l'aide de l'API ApplyGuardrail, offrant une expérience utilisateur cohérente et aidant à normaliser les contrôles de sécurité et de confidentialité.

Le nouveau niveau Standard améliore les filtres de contenu et les protections contre les sujets refusés dans Bedrock Guardrails en offrant une détection plus robuste des variations d'invite et de réponse, une défense renforcée contre toutes les catégories de filtres de contenu, y compris les attaques rapides, et une prise en charge linguistique étendue. Le filtre d'attaques rapides amélioré fait clairement la distinction entre les jailbreaks et les injections rapides sur le backend tout en protégeant contre d'autres menaces, notamment la manipulation des sorties. Pour accéder aux fonctionnalités du niveau Standard, les clients doivent explicitement opter pour l'inférence interrégionale avec Bedrock Guardrails.

Pour en savoir plus, consultez la documentation technique et la page produit de Bedrock Guardrails.