Le législateur comme premier ingénieur de prompts

L'hallucination de l'IA juridique est souvent un problème de format, non un problème de modèle. Structurer le sens au sein même de la loi rendrait l'IA juridique vérifiable par rapport à la source.

18 juin 2026 · Quantum Nexus Ventures FZCO

legal AI
legislation
RegTech

Chaque fois qu'une IA juridique hallucine une citation, la réaction par défaut consiste à blâmer le modèle.

La meilleure réponse est de blâmer le format.

Les lois sont rédigées pour des humains formés pendant des années à l'herméneutique juridique. Un juriste expérimenté lit « aux fins du présent règlement » et active automatiquement un cadre interprétatif construit au fil des années de faculté de droit, de pratique et à travers des centaines d'affaires. Il sait que cette formule délimite le champ d'application, qu'il existe des exceptions à l'article 14, que la Cour suprême en a nuancé la portée en 2019.

L'IA ne sait rien de tout cela. Elle infère. Et lorsqu'elle infère à partir d'un texte juridique, l'hallucination n'est qu'un autre mot pour désigner l'erreur d'interprétation.

Le problème n'est pas que les modèles sont mauvais. C'est que nous utilisons des outils du XXIe siècle pour lire des documents conçus au XIXe siècle.

Comment un humain lit la loi, et comment une machine tente de la lire

Lorsqu'un juriste lit un article, il ne le lit pas isolément. Il le lit en ayant à l'esprit l'ensemble de la pyramide normative. Il sait que ce règlement découle de telle directive, que cette directive prime sur le droit national, que cet article précis a été modifié par une disposition transitoire enfouie dans un journal officiel différent datant de trois ans.

Une IA doit reconstruire ce graphe de relations à partir de motifs statistiques. Parfois elle y parvient bien. Parfois elle invente une juridiction qui n'existe pas ou cite une décision portant le bon numéro d'affaire mais le mauvais dispositif. Non parce qu'elle ment. Parce que personne ne lui a donné la carte.

La proposition : laisser le législateur tokeniser

Tokeniser les lois ici ne désigne pas ce que fait un tokeniseur NLP, qui découpe les mots en sous-unités pour que le modèle puisse les traiter. Cela désigne quelque chose de différent : intégrer dans la norme elle-même l'information sémantique qui n'existe aujourd'hui que dans la tête du juriste expert.

Quatre couches concrètes :

Premièrement, les tokens de définition. Chaque terme doté d'un sens technique spécifique porte sa définition officielle liée directement, non pas dans un glossaire épars à la fin mais ancrée au corps de l'article. La « personne morale » en droit civil n'est pas la même que la « personne morale » en droit fiscal. La machine n'a pas à deviner. Le législateur le lui dit.

Deuxièmement, les tokens d'intention. L'exposé des motifs existe dans chaque loi mais il est rédigé en texte libre, tout aussi opaque pour l'IA que les articles eux-mêmes. Si cette intention était structurée en champs lisibles par la machine (problème résolu, partie affectée, exception anticipée), l'IA n'aurait pas besoin d'inférer le « pourquoi » de la norme. Elle le lirait directement.

Troisièmement, les tokens de hiérarchie. Quelle norme supérieure fonde cet article, quelle norme il abroge, quelle exception prévaut sur quelle règle générale. C'est la pyramide kelsénienne convertie en un graphe structuré. Aujourd'hui, l'IA reconstruit ce graphe avec des probabilités. Avec des tokens, ce serait déterministe.

Quatrièmement, les tokens d'interprétation vivante. Lorsque la Cour suprême ou la Cour constitutionnelle établit une doctrine sur un article précis, cette interprétation pourrait être annotée directement sur le texte de la loi, mise à jour en temps réel. La norme et son interprétation jurisprudentielle, synchronisées.

L'objection évidente

« Les lois sont faites par des juristes, pas par des ingénieurs de prompts. »

C'est vrai. Mais les juristes qui rédigèrent les premiers codes au XIXe siècle n'étaient pas non plus imprimeurs, et pourtant ils adoptèrent le format de l'imprimé parce que c'était le système de diffusion de l'époque.

Le système de diffusion du droit au XXIe siècle, c'est l'IA. Les juristes qui le comprennent avant tout le monde seront ceux qui façonneront la manière dont le droit sera interprété pour les décennies à venir.

Il ne s'agit pas que les législateurs apprennent à coder. Il s'agit que les systèmes entourant la production législative adoptent des normes de structuration sémantique de la même manière qu'ils adoptèrent le HTML à l'arrivée du web.

Ce qui existe déjà et pourquoi cela ne suffit pas

Akoma Ntoso est une norme XML pour les documents législatifs, utilisée par plusieurs parlements africains et par le Parlement européen. EUR-Lex structure les règlements européens avec des métadonnées de hiérarchie. ELI (European Legislation Identifier) attribue des URI persistantes aux normes.

Ce sont des squelettes. Ce sont des formats de publication, non des formats de sens. Ils vous disent qu'un article est un article, qu'une section appartient à un chapitre. Ils ne vous disent pas ce que signifient les « dommages indirects » dans le contexte spécifique de cet article, ni comment cela se rattache à la doctrine de la Cour suprême sur les cinq dernières années.

La proposition se situe un niveau au-dessus : structurer non pas le contenant (la norme en tant que document) mais le contenu (la norme en tant que sens).

Le changement que personne ne réclame mais qui arrive

À l'heure actuelle, les modèles d'IA juridique — y compris les nôtres chez Nexus Legal, couvrant 63 jurisdictions — compensent l'absence de structure sémantique par des systèmes de récupération (retrieval), de reclassement (reranking), de vérification croisée et de vérification de la fidélité des citations. Ils fonctionnent. Mais ce sont des compensations d'ingénierie pour un problème qui a une solution législative.

Imaginez un monde où le GDPR porterait directement annotés le concept exact de « données à caractère personnel » qu'il manie, la directive de l'UE qu'il met en œuvre, la décision la plus récente d'une autorité de contrôle ayant modulé l'interprétation de l'article 6(1)(f), et les affaires de la CJEU applicables. Non pas sous forme de PDF avec des notes en marge. Sous forme de métadonnées structurées que tout système peut lire et utiliser.

Ce monde fait passer l'IA juridique de « probablement correcte » à « vérifiable par rapport à la source ».

Les parlements qui adopteront cette pratique les premiers produiront un droit que l'IA pourra interpréter correctement sans effort. Ceux qui ne le feront pas continueront de voir leurs normes engendrer hallucinations, erreurs d'interprétation et litiges inutiles. Non parce que l'IA est mauvaise, mais parce que le format législatif est opaque.

Le législateur comme premier ingénieur de prompts. Pas une métaphore. Une description technique de ce qui arrive.

Ceci est un article d'opinion et de leadership éclairé. Il ne constitue pas un conseil juridique ou financier.

Plus d'articles

← Retour aux Insights