Directrice de recherche CNRS à l’Institut Jean Nicod de l’ENS-PSL, la linguiste Alda Mari, formée aux lettres classiques et à la linguistique computationnelle et médaille de l’innovation 2025 du CNRS, s’intéresse depuis 15 ans aux distinctions entre vérité objective et subjective. Des travaux théoriques ? Certes, mais qui, instillés dans un outil IA du nom d’INTACT, pourraient aider les services publics dans leur mission de gestion de crises. Et donc, sauver des vies. Comment ? La lauréate de la Médaille de l’innovation 2025 du CNRS l’explique à Télescope.
Vous êtes spécialiste de la sémantique dîte « formelle. » Avant tout, qu’est-ce donc que la sémantique formelle ?
La sémantique est l’étude du sens. Si l’on suit une conception non-formelle de la sémantique, quand on vous dit « banane », vous avez, dans votre tête, une représentation d’une banane. Le sens de « banane » réside donc la représentation cognitive d’une banane. D’après la sémantique formelle, le sens de banane est l’ensemble des bananes dans un contexte donné. Ce qui compte est la relation entre le mot et les choses du monde. La sémantique formelle estime que les phrases sont vraies ou fausses en fonction d’un monde donné. Elle part du principe que les phrases ont ce qu’on appelle des conditions de vérité, qui désignent comment le monde doit être pour que les phrases soient vraies ou fausses. La signification de la phrase réside dans ces conditions de vérité. Elle est la relation entre ce que je dis et ce qui est. C’est une sémantique qui a besoin du monde et aussi des mondes possibles. Parce qu’une phrase est vraie ou fausse objectivement dans le monde actuel. Mais elle peut aussi être vraie ou fausse subjectivement.
Donc, dans le monde actuel et dans les conditions de la physique actuelle, l’eau boue à 100°…
C’est vrai.
Mais, dans une autre galaxie, l’eau ne boue peut-être pas à 100° ?
Exactement. Et la phrase sera fausse. La vérité et la fausseté deviennent relatives à un monde donné. Dans le langage, la vérité et la fausseté sont souvent exprimées comme subjectives. Par exemple : je dis que « je crois que Pierre est tombé. » Dire « je crois que », c’est exprimer une vérité dans des mondes possibles. Ce n’est pas dire que c’est vrai dans le monde actuel, mais seulement dans les mondes de mes propres représentations. La langue est truffée de toutes ces expressions comme « je crois que. » Entre êtres humains, il est très rare que l’on décrive le monde actuel. On est généralement dans la conjecture, l’hypothèse, à imaginer ce qui aurait pu être ou ce qui sera. On parle beaucoup du futur. Et le futur, par définition, n’a pas de condition de vérité. Parce que le monde futur n’existe pas encore. Une phrase au futur, n’est ni vraie, ni fausse. Pourtant, nous employons le futur. Parce que nous créons des représentations de ce qu’est le futur.
On ne peut même pas dire que nous allons tous mourir. Peut-être que les transhumanistes feront que non ?
Exactement. Si ça se trouve, on partira sur Mars. C’est possible. Pour parler du futur, on a des conditions de normalité. Ça peut aller loin. Si je vous dis que je serai là à 15h30 et que j’ai pris la ligne 10 du métro parisien, comme elle fonctionne bien, ça devrait aller. Mais si je dis que j’arrive à 15h, rue Pouchet, en prenant la ligne 13, là, on se dit qu’il y aura peut-être 10 minutes de battement. Parce que la 13 fonctionne mal. Tous ces raisonnements que nous faisons sont faits parce que nous considérons des mondes possibles sur lesquels nous mettons plein de conditions : conditions de normalité, de prototypicalité, des conditions de tout ce que l’on sait. Ma spécialité, c’est ça : la construction de ces univers-là et comment on encode la construction de la vérité.
Comment êtes-vous passée de ces études théoriques à la création d’INTACT, une IA qui a un impact dans le monde physique ?
Toutes ces questions sur la subjectivité étaient déjà entrées dans le traitement automatique du langage naturel. Mais de manière très simple… En 2017, le ministère de l’Intérieur a lancé un appel à projet sur la gestion des crises. C’est là que j’ai contacté mon amie informaticienne, Farah Benamara, qui travaille à l’IRIT, l’Institut de Recherche en Informatique de Toulouse. Ce que demandait le ministère était donc un outil permettant de gérer les urgences. Quand on y pense, une urgence n’est pas quelque chose qui est dit. C’est quelque chose qui est évalué. On décrit une situation et un être humain décide si, oui ou non, il s’agit d’une situation urgente. En 2017, les systèmes de traitement du langage automatique étaient capables de reconnaître des noms, des entités nommées, des lieux, des choses très simples. Ce que nous avons apporté est ce qu’on appelle la sentiment analysis : est-on content ? Ou pas content ? Et puis l’emotional récognition, basée sur une typologie d’émotions. Très peu de choses avaient été faites sur les états épistémiques des sujets, sur la croyance, sur les attitudes vis-à-vis de la réalité. Sur ce que l’on attend qu’il soit fait.
INTACT sert à détecter l’urgence dans des situations de crises. Il est capable de lire en temps réel les réseaux sociaux et de faire remonter les messages d’alerte signalant la nécessité d’une intervention de la part des secours. Il est aussi capable de mettre en œuvre un suivi post-crise avec l’identification des messages de soutien ou de critique. De quels genres de crises parle-t-on ?
On a beaucoup travaillé sur les désastres naturels : ouragans, tempêtes, inondations. Mais aussi sur l’incendie de Notre-Dame, sur des écroulements d’immeubles. On peut même appliquer Intact à des cas de sécheresse. Aujourd’hui, quand une crise se déclenche, le ministère de l’Intérieur mobilise des bénévoles. Ces personnes lisent les réseaux sociaux eux-mêmes. Ils les ouvrent et piochent tous les messages qui paraissent importants. Parce que quand une crise se déclenche, les gens d’aujourd’hui ont beaucoup moins tendance à appeler les numéros d’urgence. Ils tweetent, ils prennent des photos, ils expliquent, ils racontent. Sans nécessairement s’en rendre compte, ils donnent tout un tas de renseignements sur ce qu’il se passe sur le terrain. Comme quelqu’un qui dit de ne pas passer par un tel chemin, qu’une route est bloquée. Pour les pompiers, c’est potentiellement très important. Intact permet de récolter ce genre d’informations. La masse d’information est traitée, les secours la reçoive dans leurs cellules de crises. Quelqu’un lit et cela permet de décider d’où intervenir.
Comment INTACT lit-il exactement les réseaux sociaux ?
Nous avons travaillé sur Twitter. Intact ne lit rien dans les réseaux sociaux fermés. Il lit ce qui est lisible, ce qui est déterminé par une réglementation totalement indépendante. On dit qu’on « aspire » les tweets. Ils entrent dans une machine, Intact les lit puis les classe, suivant des catégories élaborées avec le ministère : dégâts humains, dégâts matériels, critiques, soutiens, messages de condoléances… Il y a toutes sortes de catégories, classées selon l’urgence et selon le type d’actionnabilité : est-ce qu’il faut envoyer tel ou tel secours ? Quand on regarde Intact, on a une série de messages qui apparaissent dans des couleurs différentes. On clique sur la pastille de couleur, on récupère tous les messages d’une même catégorie et on voit si oui ou non ils sont pertinents. Intact ne se substitue donc pas aux personnes, il leur permet de gérer une immense masse de données très rapidement. Un SDIS a déjà adopté Intact. Ils sont en train de le tester. On espère que d’autres suivront !