Des cerveaux en silicone
Valentina Borghesani explore comment le sens est créé dans notre cerveau. Pour cela, elle travaille avec des patients aphasiques, mais aussi de plus en plus avec des modèles langagiers d’intelligence artificielle (IA), qui peuvent être utilisés pour simuler les processus ayant lieu dans le cerveau.
de Roger Nickl.

© Pixabay
« Citron, acide, juteux » : Lesquels de ces mots sont les plus proches d’après vous ? Et qu’en est-il de « guitare, basse, violon », « tigre, lion, tortue » ou « pizza, ananas, pepperoni » ? Dans une étude, Valentina Borghesani a donné à des participant.e.s de nombreux triplets de mots comme ceux-là, qui variaient selon s’ils étaient plutôt concrets ou abstraits. Les participant.e.s devaient ensuite rapporter les termes qui étaient les plus liés. La scientifique en neurocognition a également donné la tâche à différents modèles langagiers d’intelligence artificielle (IA).
Des résultats de cette étude, les chercheuses et leur collègues du laboratoire CNeuromod à l’Université de Montréal ont développé une base de données disponible gratuitement pour tous les chercheur.se.s pour tester et comparer la connaissance sémantique des humains et des machines. « Je pense que notre base de données est une bonne façon de tester à quel point on peut se rapprocher de la représentation sémantique du cerveau humain avec l’IA, » dit la scientifique, qui a conduit l’étude au Neurocentre de l’Université de Genève et au PRN Evolving Language. « L’idée est que maintenant les chercheur.se.s puissent l’utiliser pour tester les performances de leur modèles langagiers. »
Quand les mots perdent leur sens
Valentina Borghesani s’intéresse au langage et la pensée. Elle étudie comment le contenu sémantique, c’est-à-dire notre connaissance, est crée et stocké dans notre cerveau, et comment il peut être perdu dans des maladies neurodégénératives. Elle examine aussi quelles zones cérébrales sont impliquées dans ces processus. Le langage y joue un rôle important, mais pas le plus grand. Il est vrai que nous utilisons le langage pour communiquer des concepts mentaux, c’est-à-dire des idées sur le monde, et que c’est aussi le moyen le plus courant d’apprendre des concepts similaires. Mais le langage et la pensée ne sont pas toujours congruents. « Il y a des concepts pour lesquels nous n’avons pas d’étiquettes, de mots, » raconte Borghesani, « et au contraire, il y a des mots auxquels nous ne pouvons pas initialement lier de concept – par exemple lors de l’apprentissage d’un nouveau langage. » L’intelligence humaine va bien au-delà du langage, selon la chercheuse.
Pour obtenir une nouvelle perspective sur les bases neurobiologiques du langage et de la pensée, ainsi que l’émergence de la connaissance sémantique, Valentina Borghesani travaille avec des patients aphasiques, mais aussi de plus en plus avec des modèles langagiers s’appuyant sur l’IA. Pour les personnes souffrant d’une certaine forme d’aphasie – à savoir la variante sémantique de l’aphasie primaire progressive (svPPA) – les mots perdent progressivement leur sens, et ils ont des difficultés pour reconnaître les objets et les visages. « Ce type de maladies neurodégénératives permet d’étudier comment des déficiences dans des régions spécifiques du cerveau peuvent affecter les fonctions linguistiques et sémantiques, » explique la chercheuse.
De cette manière, elle espère obtenir de nouvelles informations sur comment et où notre cerveau crée du sens et quel rôle le langage joue dans ce mécanisme. Mais pas seulement ! « Plus on en sait sur ces connexions, plus on peut faire pour des patient.e.s atteint.e.s par cette forme d’aphasie, » dit Borghesani. Avec l’aide des nouvelles connaissances du laboratoire de Borghesani, des thérapies de réhabilitation plus efficaces pourraient être développées dans le futur, et des procédures de diagnostics pourraient aussi être mises en place pour détecter l’apparition de l’aphasie à un stade précoce.
Lésions virtuelles
Travailler avec des patient.e.s aphasiques est important dans la recherche de Valentina Borghesani, mais l’utilisation de l’IA est de plus en plus importante. « Les modèles d’IA sont tellement bons actuellement que nous pouvons les utiliser presque comme des cerveaux in-silico pour notre recherche, et faire des expériences avec eux, » raconte la scientifique. « Ils peuvent nous permettre d’en apprendre plus sur notre propre cerveau. » En entraînant l’IA avec des données différentes ou en endommageant délibérément le modèle en lui infligeant des lésions virtuelles, comme c’est le cas dans l’aphasie, les chercheur.se.s au Neurocentre de l’Université de Genève peuvent utiliser ces modèles pour faire et tester des prédictions sur certaines activités (ou leur absence) dans le cerveau humain.
Par exemple, ces modèles peuvent être utilisés pour étudier la dissociation de la syntaxe et de la sémantique, et déterminer quelles régions du cerveau sont impliquées, comme cela a été fait dans une étude récente. « Travailler avec des modèle d’IA est une approche relativement nouvelle dans notre domaine de recherche et nous devons encore en savoir plus sur comment ces modèles fonctionnent, » dit Valentina Borghesani. « Mais nous arrivons graduellement au point où nous pouvons les utiliser pour des tests virtuels de nos théories sur le cerveau humain. »
Simuler la conversation humaine
Le flux de connaissance va aussi dans l’autre sens : la recherche des neuroscientifiques comme Valentina Borghesani peuvent aussi contribuer à l’amélioration des modèles d’IA – surtout quand il s’agit de questions de sémantique. A cause de cela, les modèles langagiers ont encore des grandes lacunes. ChatGPT peut, par exemple, composer des textes cohérents en très peu de temps, écrire des résumés ou traduire des textes d’une langue vers presque n’importe quelle autre. « Le système excelle vraiment à ça, » rapporte Borghesani. « Il mimique la conversation humaine, et simule les comportements et l’intelligence humaine. » Mais la capacité linguistique de la machine est limitée surtout à l’écriture de texte. Et elle produit du langage sans vraiment en comprendre le contenu.
« D’un autre côté, le système de langue humain est multimodal, » dit Borghesani. Il consiste de langage parlé et écrit. Et il est basé sur des expériences physiques – sensorielles, auditives, visuelles et tactiles – et sur la connaissance du monde. Les modèles IA n’ont aucun des deux. C’est pourquoi ils ont du mal, par exemple, à comprendre les métaphores ou voir des similarités qu’un humain remarquerait immédiatement. « Plus on en sais sur comment le langage humain et l’intelligence humaine fonctionnent, mieux on peut orienter les expert.e.s en IA sur la direction dans laquelle ils devraient développer leurs modèles langagiers pour améliorer leur performance, » explique la chercheuse.
Avec son travail, Valentina Borghesani veut contribuer à améliorer la représentation sémantique, la compréhension linguistique des modèles d’IA. En même temps, elle a une condition : « Quand on parle de comment nous pouvons optimiser ces modèles, nous devons aussi toujours nous demander pourquoi nous voulons faire ça. » Si le but est de faire en sorte qu’il soit plus facile de travailler avec les textes ou créer des assistant.e.s virtuel.le.s pour rendre notre vie plus facile, par exemple avec des recherches de littérature ou des traductions de texte, il n’y a rien qui nous arrête pour continuer le développement des modèles IA. « Cependant, si le but à long-terme est de créer une intelligence artificielle générale, je ne suis pas sûre de le souhaiter, et si l’amélioration du traitement du langage nous mènerait même à cela, » dit Valentina Borghesani. Pour l’instant, la neuroscientifique est surtout intéressée par des modèles plus puissants qui lui permettraient de mieux comprendre notre cerveau, notre intelligence et notre capacité à parler.