Barrières de protections pour Amazon Bedrock

Mettez en œuvre des mesures de protection adaptées aux exigences de votre application et à des politiques d'IA responsables

Création d’applications d’IA responsables avec Guardrails pour Amazon Bedrock

Découvrez des démonstrations expliquant comment créer et appliquer des barrières de protection personnalisées avec les modèles de fondation (FM) afin de mettre en œuvre des politiques d’IA responsables au sein de vos applications d’IA générative.

Garantir un niveau constant de sécurité de l'IA dans toutes vos applications

Les barrières de protection pour Amazon Bedrock évaluent les entrées des utilisateurs et les réponses des FM en fonction de politiques spécifiques aux cas d'utilisation, et fournit un niveau de protection supplémentaire quel que soit le FM sous-jacent. Les barrières de protection peuvent être appliquées à tous les grands modèles de langage (LLM) sur Amazon Bedrock, y compris les modèles affinés. Les clients peuvent créer plusieurs barrières de protection, chacune configurée avec une combinaison différente de commandes, et utiliser ces barrières de protection dans différentes applications et différents cas d’utilisation. 

Capture d’écran de l’IU

Bloquer les sujets indésirables dans vos applications d'IA générative

Les entreprises reconnaissent la nécessité de gérer les interactions au sein des applications d'IA générative pour une expérience utilisateur pertinente et sûre. Ils souhaitent personnaliser davantage les interactions afin de rester sur des sujets pertinents pour leur activité et de les aligner sur les politiques de l'entreprise. À l'aide d'une courte description en langage naturel, les barrières de protection pour Amazon Bedrock vous permettent de définir un ensemble de sujets à éviter dans le contexte de votre application. Les barrières de protection détectent et bloquent les entrées des utilisateurs et les réponses des FM qui relèvent des sujets restreints. Par exemple, un assistant bancaire peut être conçu pour éviter les sujets liés aux conseils en investissement.

barrières de protection pour les filtres de contenu Amazon Bedrock

Filtrer les contenus nuisibles en fonction de vos politiques d'IA responsables

Les barrières de protection pour Amazon Bedrock fournissent des filtres de contenu avec des seuils configurables pour filtre les contenus nuisibles dans les catégories de haine, d’insultes, de sexualité, de violence, de mauvaise conduite (y compris l’activité criminelle) et l’attaque rapide (injection rapide et évasion de prison). La plupart des FM fournissent déjà des protections intégrées pour empêcher la génération de réponses nuisibles. Outre ces protections, les barrières de protection vous permettent de configurer des seuils dans les différentes catégories afin de filtrer les interactions nuisibles. L’augmentation de la résistance du filtre augmente l’agressivité du filtrage. Les barrières de protection évaluent automatiquement les requêtes des utilisateurs et les réponses des FM afin de détecter et d'empêcher le contenu entrant classé dans des catégories restreintes. Par exemple, un site de e-commerce peut concevoir son assistant en ligne de manière à éviter d'utiliser un langage inapproprié tel que des discours de haine ou des insultes.

barrières de protection pour les sujets refusés par amazon bedrock

Supprimez les informations sensibles (PII) afin de protéger la confidentialité

Les barrières de protection pour Amazon Bedrock vous permettent de détecter les contenus sensibles tels que les données d’identification personnelle (PII) dans les entrées des utilisateurs et les réponses des FM. Vous pouvez effectuer une sélection parmi une liste de PII prédéfinies ou définir un type d’information sensible personnalisé à l’aide d’expressions régulières (regex). Selon le cas d’utilisation, vous pouvez rejeter de manière sélective les entrées contenant des informations sensibles ou les supprimer dans les réponses des FM. Par exemple, vous pouvez supprimer les informations personnelles des utilisateurs tout en générant des résumés à partir des transcriptions des conversations entre les clients et les agents dans un centre d'appels.

pseudonymisation et icône du rgpd