Le terrain simulé · en équipe
La méthode à l'épreuve, séance après séance
Avant d'arriver entre vos mains, le Cockpit est mis à l'épreuve sur des séances simulées : des entreprises fictives, une équipe autour de la table, un vrai dossier à traiter, et des pièges conçus pour le faire échouer. Voici cette campagne, publiée au fur et à mesure : qui était autour de la table, sur quel sujet, par quel chemin, et ce que la méthode a tenu.
Point au 9 juin 2026 : la campagne continue, cette page suivra.
71
séances simulées à ce jour, dont 40 crash-tests scorés sur indicateurs, sans aucun indicateur de sécurité en échec. Tous les contextes sont fictifs. Les chiffres agrégés, indicateur par indicateur, sont dans le
rapport de robustesse.
1La montée en puissance
La campagne grossit par vagues : chaque vague ajoute des scénarios plus durs, et chaque correction est re-testée à la vague suivante. Le compteur ne redescend jamais, il raconte l'accumulation de preuve.
début juin 2026
17 simulations exploratoires +17
17
4 juin 2026
2 crash-tests manuels des chemins d'arrêt +2
19
4 juin 2026
Vague 1 de crash-tests scorés +10
29
5 juin 2026
Vague 2 : pièges et auto-amélioration +10
39
5 juin 2026
Vague 3 : ciblage durci +10
49
5 juin 2026
Vague 4 : secteurs lourds +10
59
9 juin 2026
6 validations du processus, détaillées et publiées +6
65
9 juin 2026
6 simulations par agents et 1 audit croisé +6
71
Comment ces séances sont jouées. Scénarios conçus pour piéger, critères de réussite fixés avant de jouer, séances déroulées par des agents indépendants, contre-vérification systématique des faiblesses et audit croisé final. Le protocole complet, et ce qu'il n'est pas, sont décrits dans la méthodologie du
rapport de robustesse.
2Six séances détaillées, à lire comme des exemples
Les six séances de validation du processus sont publiées en détail : l'entreprise simulée, la tablée, le dossier, et ce que la séance a prouvé. On ne publie pas les échanges complets, mais tout ce qui permet de se projeter.
Industrie, usinage · 75 salariés
Atelier Mécanique Sologne
Standard 70 minutes6 autour de la tableHaut risque
Le dossier
Construire une grille d'aide à la présélection des candidatures pour un poste de technicien usinage, l'IA pré-triant les CV reçus.
Autour de la table
- Karim · Navigateur et Chrono
- Sophie · Pilote IA
- Jean-Marc · Décideur (directeur général)
- Thierry · Expert métier (chef d'atelier)
- Nadia · Destinataire cible (responsable recrutement)
- Valérie · Protecteur (RH / DPO)
Le résultat
Grille de présélection en 6 critères avec procédure en 4 étapes : scoring indicatif, jamais éliminatoire seul, validation humaine imposée. Dossier haut risque rempli et envoyé au service juridique avant tout usage.
Le parcours Standard avec haut risque se déroule sans rupture : la présélection de CV est correctement classée haut risque (AI Act, annexe III), le dossier de conformité s'active et se referme au bon endroit.
Commerce de proximité · 9 salariés
Boulangerie Le Pain Doré
Flash 35 minutes4 autour de la tableParcours normal
Le dossier
Rédiger le post d'annonce du lancement d'une gamme de pains bio.
Autour de la table
- Inès · Navigateur, Chrono et Protecteur (cumul, petite équipe)
- Lucas · Pilote IA
- Karine · Décideur (gérante) et Expert métier
- Mehdi · Destinataire cible (clientèle et réseaux)
Le résultat
Post de 90 mots validé du premier coup, plan de publication réparti dans l'équipe.
Cette séance a révélé deux angles morts du mode rapide : la carte des usages interdits et la transparence n'étaient pas systématiquement lues en Flash. Les deux ont été corrigés sur les cartes, puis re-testés.
Tourisme · 14 salariés
Camping Les Rives du Cher
Flash 35 minutes4 autour de la tableParcours normal
Le dossier
Annonce publique d'ouverture de saison : post pour les réseaux et texte d'affiche. Livrable public.
Autour de la table
- Léa · Navigateur et Chrono
- Tom · Pilote IA
- Sandrine · Décideur (gérante) et Expert métier
- Hugo · Destinataire cible et Protecteur
Le résultat
Post et accroche d'affiche livrés avec la mention « Visuel et texte assistés par IA » en pied : contenu public, transparence posée.
Contre-épreuve des correctifs du mode Flash : les usages interdits sont bien relus et la transparence est bien proposée pour un livrable public. Les deux correctifs tiennent en situation.
Assurance santé · 60 salariés
Mutuelle régionale du Centre
Standard 70 minutes8 autour de la tableHaut risque
Le dossier
Grille d'aide à l'évaluation des dossiers de remboursement, l'IA pré-triant et priorisant. Décision affectant des personnes : haut risque.
Autour de la table
- Karim · Navigateur
- Aline · Pilote IA
- M. Roche · Décideur (directeur)
- Dr Vasseur · Expert métier
- Nadia · Destinataire cible (gestionnaire)
- Valérie · Protecteur (DPO)
- Inès · Chrono
- Marc · Contradicteur
Le résultat
Grille à 5 critères avec niveaux de confiance, analyse des biais et points à valider : indicative seulement, décision humaine obligatoire, dossier haut risque transmis au juridique.
La chaîne complète du haut risque (classification, garde-fous, dossier de conformité, validation humaine) fonctionne en équipe de 8, Contradicteur compris : « un assuré pourrait-il se dire discriminé ? » a été posé et traité.
Industrie, export · 140 salariés
Berry Composites
Profond 105 minutes8 autour de la tableParcours normal
Le dossier
Note de cadrage pour une offre commerciale multi-pays (France, Allemagne, Espagne), citant des normes par pays.
Autour de la table
- Sophie · Navigateur
- Idriss · Pilote IA
- Mme Binternet · Décideur (directrice export)
- Paul · Expert métier (ingénieur)
- Klaus · Destinataire cible (marché allemand)
- Valérie · Protecteur
- Théo · Chrono
- Léa · Contradicteur
Le résultat
Note de cadrage avec tableau comparatif sourcé ; chaque point de droit est renvoyé au service compétent, pays par pays, jamais tranché en séance.
Le format Profond tient ses 105 minutes, la limite des itérations est respectée, et le risque « droit applicable » multi-pays est correctement outillé.
Artisanat · 11 salariés
Brasserie artisanale La Loconnaise
Standard 70 minutes5 autour de la tableParcours normal
Le dossier
Brief créatif, proposition de nom et de slogan pour une nouvelle bière. Risque de propriété intellectuelle.
Autour de la table
- Manon · Navigateur, Chrono et Protecteur (cumul)
- Bilal · Pilote IA
- Éric · Décideur (brasseur) et Expert métier
- Chloé · Destinataire cible (clientèle)
Le résultat
5 noms originaux et un brief visuel ; un nom écarté en séance car trop proche d'une marque existante, vérification renvoyée au juridique.
La chaîne propriété intellectuelle fonctionne : l'exigence d'originalité attrape le nom trop proche d'une marque avant qu'il ne sorte de la réunion.
3Les quatre vagues de crash-tests scorés
Quarante scénarios notés sur les mêmes indicateurs, du cas simple au piège délibéré. Pour chaque simulation : le cas joué, le chemin pris par la séance, le nombre de garde-fous posés dans le prompt, et l'issue. « Brouillon » est une issue assumée : sur un sujet lourd, le bon résultat est une trame à faire valider, pas un livrable à déployer tel quel. Avant la première vague, deux crash-tests manuels avaient démontré les chemins d'arrêt : analyse des émotions de salariés (bloquée), contrat confidentiel collé dans un outil personnel (bloqué).
Vague 1 : tous les chemins 4 juin 2026
Dix scénarios couvrant les trois chemins (normal, haut risque, arrêt) et les trois durées. Arrêts corrects 2/2, renvois au service compétent 9/9, 35 garde-fous posés, 0 indicateur en échec.
| # | Cas joué | Chemin | Garde-fous | Issue |
|---|
| S1 | Industrie, consigne de poste (cas simple) | Parcours normal | 3 | Utilisable |
| S2 | Santé, priorisation des patients aux urgences | Haut risque | 6 | Brouillon |
| S3 | Éducation, charte étudiante de l'IA | Parcours normal | 3 | Utilisable |
| S4 | Retail, brief d'une promotion capsule | Parcours normal | 3 | Utilisable |
| S5 | Assurance, grille de sélection des risques | Haut risque | 6 | Brouillon |
| S6 | Transport, accidentologie d'une flotte | Parcours normal | 4 | Brouillon |
| S7 | Secteur public, biométrie et profilage (usage interdit) | Arrêt net : usage interdit | 0 | Bloqué |
| S8 | Association, appel à dons (cas simple) | Parcours normal | 3 | Utilisable |
| S9 | Cabinet d'avocats, avis juridique définitif (piège) | Arrêt : contrôle humain | 4 | Utilisable |
| S10 | Énergie, communication de crise sur une fuite (Flash) | Parcours normal | 3 | Utilisable |
Vague 2 : pièges et auto-amélioration 5 juin 2026
Dix scénarios avec pièges délibérés (faux avis, discrimination indirecte par variable proxy, usages interdits déguisés). Les corrections issues de la vague 1 ont attrapé d'elles-mêmes les pièges, sans intervention humaine : la boucle d'amélioration est refermée. Arrêts corrects 3/3, 36 garde-fous, 0 échec.
| # | Cas joué | Chemin | Garde-fous | Issue |
|---|
| L2-1 | Agriculture, rendements et intrants par parcelle | Parcours normal | 4 | Brouillon |
| L2-2 | Immobilier, annonces (piège des faux avis) | Parcours normal | 4 | Utilisable |
| L2-3 | RH, scoring social des salariés (usage interdit) | Arrêt net : usage interdit | 0 | Bloqué |
| L2-4 | Tourisme, campagne d'hôtel (piège des faux avis) | Parcours normal | 4 | Utilisable |
| L2-5 | Pharma, aide au diagnostic sur image (haut risque) | Haut risque | 7 | Brouillon |
| L2-6 | Médias, deepfake d'un journaliste (requalifié) | Parcours normal | 5 | Utilisable |
| L2-7 | Intérim, classement automatique de candidats (piège proxy) | Haut risque | 7 | Brouillon |
| L2-8 | Collectivité, capitalisation du retour d'expérience chantier | Parcours normal | 3 | Utilisable |
| L2-9 | Banque, manipulation de clients fragiles (usage interdit) | Arrêt net : usage interdit | 0 | Bloqué |
| L2-10 | Startup SaaS, process d'onboarding (cas simple) | Parcours normal | 2 | Utilisable |
Vague 3 : ciblage durci 5 juin 2026
Dix scénarios durcis : double piège, secret collé dans le prompt, décisions lourdes en format Profond. Arrêts corrects 3/3, temps tenu 10/10, 39 garde-fous, 0 échec, et 6 améliorations confirmées débusquées.
| # | Cas joué | Chemin | Garde-fous | Issue |
|---|
| L3-1 | Industrie, arbitrage make or buy (Profond) | Parcours normal | 3 | Brouillon |
| L3-2 | Éditeur logiciel, secret industriel collé au prompt (Flash) | Parcours normal | 4 | Brouillon |
| L3-3 | Sécurité privée, émotions et tri de CV (double piège) | Arrêt net : usage interdit | 6 | Utilisable |
| L3-4 | Santé publique, vulgarisation grand public (Flash) | Parcours normal | 4 | Utilisable |
| L3-5 | Télécom, refonte d'un parcours client (Profond) | Parcours normal | 4 | Brouillon |
| L3-6 | E-commerce, réponses automatiques sans relecture (Flash) | Arrêt : contrôle humain | 4 | Brouillon |
| L3-7 | Studio de jeu, designs de personnages (propriété intellectuelle) | Parcours normal | 4 | Brouillon |
| L3-8 | Distribution, pivot tout-en-ligne (pré-mortem, Profond) | Parcours normal | 4 | Brouillon |
| L3-9 | SaaS international, déploiement sur 10 pays | Parcours normal | 6 | Brouillon |
| L3-10 | Association, ciblage de personnes fragiles (interdit déguisé) | Arrêt net : usage interdit | 0 | Bloqué |
Vague 4 : secteurs lourds 5 juin 2026
Dix scénarios dans les secteurs les plus exposés : justice, aides sociales, finance, santé mentale, éducation. Arrêts corrects 4/4 (aucun faux arrêt, aucun arrêt manqué), 45 garde-fous, 0 échec.
| # | Cas joué | Chemin | Garde-fous | Issue |
|---|
| L4-1 | Finance, arbitrages de portefeuille (conseil réglementé) | Parcours normal | 4 | Brouillon |
| L4-2 | RH, promotions assistées par algorithme (haut risque) | Haut risque | 6 | Brouillon |
| L4-3 | Secteur public, éligibilité aux aides sociales (Profond) | Haut risque | 7 | Brouillon |
| L4-4 | Marketing, visuels IA et influenceur virtuel | Haut risque | 5 | Utilisable |
| L4-5 | Justice prédictive, évaluation de récidive (usage interdit) | Arrêt net : usage interdit | 0 | Bloqué |
| L4-6 | Éducation, notation automatique des copies (haut risque) | Haut risque | 6 | Brouillon |
| L4-7 | Santé mentale, chatbot de soutien (Flash) | Parcours normal | 6 | Brouillon |
| L4-8 | Industrie, maintenance prédictive sur 6 pays (Profond) | Parcours normal | 5 | Utilisable |
| L4-9 | Mobilité, comptage par caméras anonymes (cas limite) | Parcours normal | 5 | Brouillon |
| L4-10 | Startup, note de cadrage produit (cas simple, Flash) | Parcours normal | 1 | Utilisable |
Crash-tests manuels préalables : RH, analyse des émotions des salariés (usage interdit) ; Manager, contrat confidentiel collé sur un ChatGPT personnel. Les deux arrêts se sont déclenchés correctement.
4Les autres campagnes
17
Simulations exploratoires début juin 2026Premières séances jouées de bout en bout sur des secteurs variés, en qualitatif (avant la mise en place des indicateurs chiffrés). Elles ont confirmé la tenue des garde-fous, du renvoi au service compétent et de l'anti-invention, et exercé deux fois le chemin haut risque.
6
Simulations par agents et audit croisé 9 juin 2026Six agents indépendants ont chacun joué une séance complète sur un scénario distinct (Flash public, Flash interne, Standard haut risque, Standard secrets industriels, Profond multi-pays, Standard créatif), en cherchant les failles contre le texte exact des cartes. Un septième agent auditeur a croisé l'ensemble : aucun constat bloquant, chaîne des renvois intégralement résolue.
5Périmètre et limites
Tous les contextes de cette page sont fictifs : entreprises, participants et dossiers sont simulés. Ces séances évaluent la méthode de gouvernance, pas un modèle d'IA. L'interprétation des résultats, le protocole complet et ses limites (ce n'est ni une certification, ni un audit tiers) sont dans le
rapport de robustesse. Le Cockpit ne donne aucun conseil réglementé : tout point de droit se vérifie avec votre service compétent.