Atelier CAPGEMINI - IA contre IA : Le Red Teaming nouvelle génération

19 nov. 202513:30 - 14:30
Salle 5

Programme

IA contre IA : Le Red Teaming nouvelle génération Le développement des capacités et des usages des LLMs et de l’IA agentique font apparaître une nouvelle surface d’attaque. Une des raisons du succès des LLMs est leur alignement avec des principes humains et éthiques qui permet de maîtriser leur comportement, notamment dans un cadre professionnel. Malgré la mise en place de garde-fous, il est possible de "jailbreaker" les LLMs uniquement par injection de prompts. La génération de contenus malveillants, l’obtention d’informations confidentielles, l’exécution des codes,… restent accessibles uniquement par le biais de prompts adaptés. Le "jailbreaking" a dépassé très rapidement le stade de la simple anomalie ou de l’activité artisanale pour devenir un discipline scientifique à part entière et un domaine de recherche très actif, qui progresse au rythme des développements des LLM et de l’IA agentique. Dans cet atelier, en collaboration avec un acteur public et pilote de ce sujet, nous partagerons les stratégies d’attaque les plus performantes, et comment les travaux récents, notamment menés par Capgemini, montrent que ces stratégies s’améliorent en devenant des tâches réalisées par des IA spécialisées. Au travers d'une démonstration live, nous montrerons ensuite comment des agents IA dédiés peuvent réaliser un "redteaming" automatisé, et permettre l’identification des failles pour améliorer la sécurité des systèmes déployés embarquant des LLMs ou des agents IA. Intervenants : Hussein Jawad, Senior Data Scientist. Julien Roussel, PhD, Manager Data Scientist. Nicolas Brunel, Prof., Scientific Director

Intervenant(s)