Computersprachmodelle verständlich und kontrollierbar zu machen
Der Forscher James Henderson (Idiap Research Institute) hat einen ERC Advanced Grant erhalten, um an grossen Sprachmodellen (LLMs) zu arbeiten, d.h. an computergestützten Modellen für vertieftes Lernen, die sprachbezogene Aufgaben erfüllen können.

Dieses Projekt ist eine Fortsetzung seiner Arbeit im Rahmen des NFS Evolving Language, die unser Verständnis dafür verbessert, was LLMs für menschliche Sprachen so erfolgreich macht. Es wird dieses theoretische Verständnis nutzen, um die Interpretierbarkeit (d.h. das Verständnis, warum bestimmte Vorhersagen gemacht werden) und die Kontrollierbarkeit (d.h. die Beeinflussung des Verhaltens) von LLMs zu verbessern.
„In diesem neuen Projekt werden wir uns mit der Interpretierbarkeit und Kontrollierbarkeit von LLMs befassen, indem wir sie mit einem Gedächtnis ausstatten“, erklärt der Forscher. „Wir werden uns dann darauf konzentrieren, die Auffassung und das Wissen in diesem Gedächtnis leichter verständlich zu machen und zu verändern.“