Des cerveaux en silicone
Valentina Borghesani explore comment le sens se crée dans notre cerveau. Pour cela, elle travaille avec des patients aphasiques, mais aussi de plus en plus avec des modèles de langage basés sur de l’intelligence artificielle (IA), qui peuvent être utilisés pour simuler les processus ayant lieu dans le cerveau.
par Roger Nickl.
© Celia Lazzarotto
« Citron, acide, juteux » : Lesquels de ces mots sont les plus proches d’après vous ? Et qu’en est-il de « guitare, basse, violon », « tigre, lion, tortue » ou « pizza, ananas, pepperoni » ? Dans une étude récente, Valentina Borghesani a donné à des participant.e.s de nombreux triplets de mots comme ceux-là, qui variaient du concret à l’abstrait. Les participant.e.s devaient ensuite choisir les termes qui leur semblaient être les plus proches. La scientifique, spécialisée dans le domaine des neurosciences cognitives, a donné en test le même exercice à différents modèles linguistiques d’intelligence artificielle (IA).
Grâce aux résultats de cette étude, Valentina, accompagnée de ses collègues du laboratoire CNeuromod à l’Université de Montréal, a pu développer une base de données disponible gratuitement pour tou.te.s les chercheur.se.s qui permet de tester et comparer la connaissance sémantique des humains et des machines. « Je pense que notre base de données est une bonne façon de tester à quel point on peut se rapprocher de la représentation sémantique du cerveau humain avec l’IA, » dit la scientifique, qui a mené l’étude au Neurocentre de l’Université de Genève et au PRN Evolving Language. « L’idée est que les chercheur.se.s puissent maintenant l’utiliser pour tester les performances de leurs modèles de langage. »
Quand les mots perdent leur sens
Valentina Borghesani s’intéresse au langage et la pensée. Elle étudie comment le contenu sémantique, c’est-à-dire notre connaissance, est créé et stocké dans notre cerveau, et comment il peut être perdu lors de maladies neurodégénératives. La chercheuse s’intéresse aussi aux zones cérébrales impliquées dans ces processus. Le langage y joue un rôle important, mais ce n’est pas le seul aspect à prendre en compte. Il faut reconnaître que nous utilisons le langage pour communiquer des concepts mentaux, par exemple les représentations que nous avons sur le monde. C’est aussi le moyen le plus courant d’apprendre des concepts similaires. Mais le langage et la pensée ne sont pas toujours congruents. « Il y a des concepts pour lesquels nous n’avons pas d’étiquettes, de mots, » raconte Borghesani, « et au contraire, il y a des mots auxquels nous ne pouvons pas initialement lier de concepts – par exemple lors de l’apprentissage d’un nouveau langage. » L’intelligence humaine va donc bien au-delà du langage, selon la chercheuse.
Pour obtenir une nouvelle perspective sur les bases neurobiologiques du langage et de la pensée, ainsi que l’émergence de la connaissance sémantique, Valentina Borghesani travaille non seulement avec des patients aphasiques, mais aussi de plus en plus avec des modèles linguistiques s’appuyant sur l’IA. Pour les personnes souffrant d’une certaine forme d’aphasie – à savoir la variante sémantique de l’aphasie primaire progressive (svPPA) – les mots perdent progressivement leur sens, et il leur est difficile de reconnaître les objets et les visages. « Ce type de maladies neurodégénératives permet d’étudier comment des déficiences dans des régions spécifiques du cerveau peuvent affecter les fonctions linguistiques et sémantiques, » explique la chercheuse.
De cette manière, elle espère obtenir de nouvelles informations sur comment et où notre cerveau crée du sens et quel rôle le langage joue dans ce mécanisme. Mais pas seulement ! « Plus on en sait sur ces connexions, plus on peut améliorer les conditions des patient.e.s atteint.e.s par cette forme d’aphasie, » dit Borghesani. Avec l’aide des nouvelles connaissances du laboratoire de Borghesani, des thérapies de réhabilitation plus efficaces pourraient être développées dans le futur, et des procédures de diagnostics mises en place pour détecter l’apparition de l’aphasie à un stade précoce.
Lésions virtuelles
Travailler avec des patient.e.s aphasiques est important pour la recherche de Valentina Borghesani, mais l’utilisation de l’IA l’est d’autant plus. « Les modèles d’IA sont actuellement tellement bons que nous pouvons les utiliser presque comme des cerveaux in-silico pour notre recherche, et réaliser des expériences avec eux, » raconte la scientifique. « Ils peuvent nous permettre d’en apprendre plus sur notre propre cerveau. » En entraînant l’IA avec des données différentes ou en endommageant délibérément le modèle – en lui infligeant des lésions virtuelles, comme c’est le cas dans l’aphasie, – les chercheur.se.s du Neurocentre de l’Université de Genève peuvent utiliser ces modèles pour faire et tester des prédictions sur la présence de certaines activités dans le cerveau humain (ou leur absence).
Par exemple, ces modèles peuvent être utilisés pour étudier la dissociation de la syntaxe et de la sémantique, et déterminer quelles régions du cerveau sont impliquées, comme cela a été fait dans une étude récente. « Travailler avec des modèles d’IA est une approche relativement nouvelle dans notre domaine de recherche et nous devons encore en apprendre plus sur comment ces modèles fonctionnent, » dit Valentina Borghesani. « Mais nous arrivons progressivement à un point où nous pouvons les utiliser pour des tests virtuels de nos théories sur le cerveau humain. »
Simuler la conversation humaine
Le flux de connaissance va également dans l’autre sens : la recherche de neuroscientifiques comme Valentina Borghesani peuvent aussi contribuer à l’amélioration des modèles d’IA – surtout quand il s’agit de questions de sémantique. Les modèles de langage ont encore des grandes lacunes dans ce domaine. ChatGPT peut, par exemple, composer des textes cohérents en très peu de temps, écrire des résumés ou traduire des textes d’une langue vers presque n’importe quelle autre. « Le système excelle réellement dans cela, » rapporte Borghesani. « Il mimique la conversation humaine, et simule les comportements et l’intelligence humaine. » Mais la capacité linguistique de la machine est limitée surtout à l’écriture de texte. Et elle produit du langage sans vraiment en comprendre le contenu.
« D’un autre côté, le système de langue humain est multimodal, » dit Borghesani. Il consiste de langage parlé et écrit. Et il est basé sur des expériences physiques – sensorielles, auditives, visuelles et tactiles – ainsi que sur la connaissance du monde. Les modèles IA n’ont aucun des deux. C’est pourquoi ils ont du mal, par exemple, à comprendre les métaphores ou voir des similarités qu’un humain remarquerait immédiatement. « Plus on en sait sur comment le langage et l’intelligence humaine fonctionnent, mieux on peut orienter les expert.e.s en IA sur la direction selon laquelle ils devraient développer leurs modèles langagiers pour améliorer leurs performances, » explique la chercheuse.
Avec son travail, Valentina Borghesani souhaite contribuer à améliorer la représentation sémantique et la compréhension linguistique des modèles d’IA. En même temps, elle a une condition : « Quand on parle de comment nous pouvons optimiser ces modèles, nous devons aussi toujours nous demander pourquoi nous voulons faire ça. » Si le but est de faire en sorte qu’il soit plus facile de travailler avec des textes ou de créer des assistant.e.s virtuel.le.s pour rendre notre vie plus facile, par exemple avec des recherches de littérature ou des traductions de texte, il n’y a rien qui nous arrête pour continuer le développement des modèles IA. « Cependant, si le but à long terme est de créer une intelligence artificielle générale, je ne suis pas sûre que j’aimerais aller dans ce sens. Et je ne pense pas que l’amélioration du traitement du langage nous amènerait même à cela, » dit Valentina Borghesani. Pour l’instant, la neuroscientifique est surtout intéressée par des modèles plus puissants qui lui permettraient de mieux comprendre notre cerveau, notre intelligence et notre capacité à parler.