[AWS GenAI Loft] Reply: Le Red Teaming dans les applications LLM pour une IA éthique et sécurisée
GenAI Loft | Paris
Generative AI
-
-
IN PERSON
Amine Ait El Harraj | Expert Données / ML AWS at Reply, Thomas Caquineau | Senior Solutions Architect, AWS
Français
200 - Intermediate
Speakers
Show all
Aperçu : Cette session mettra en avant le rôle essentiel du red teaming dans les tests et la vérification que les modèles d'IA répondent de manière éthique et sécurisée à divers prompts, en particulier ceux qui pourraient être intentionnellement malveillants. Nous illustrerons comment des prompts identiques peuvent générer des réponses nuisibles de certains modèles, tandis que d'autres sont suffisamment robustes pour éviter de tomber dans le piège de l'"evil prompt engineering." En adoptant la mentalité d'un attaquant, l'équipe de red teaming peut mettre à l'épreuve les défenses du modèle, en s'assurant qu'il peut faire face aux inputs malveillants conçus pour exploiter ses limites.
Aperçu Technique : Au cours de cette session, nous démontrerons une chaine DevOps simplifié sur AWS qui intègre des outils d'évaluation de modèle pour la sécurité et la fiabilité de l'IA dans le cadre du processus de red teaming. L'évaluation des modèles inclut l'utilisation d'outils tels que :
Giskard pour détecter les vulnérabilités.
SageMaker Clarify pour la détection des biais et l'explicabilité.
Les fonctionnalités d'évaluation de Bedrock pour une évaluation et comparaison complètes.
LangFuse, une plateforme open source d'observabilité des LLM.
Cas d'Usage Commercial : Centre d'appels pour prendre un rendez-vous avec des professionnels de la santé mentale. L'accent sera mis sur la résolution des problèmes de "hallucinations et risques de sécurité", qui sont identifiés comme les principales préoccupations lors du déploiement d'outils de communication pilotés par l'IA dans des environnements sensibles comme les soins de santé. En employant des pratiques rigoureuses de red teaming, nous nous assurons que l'IA gère les conversations de manière responsable et précise.