IDSIA

So kann die künstliche Intelligenz unsere Sprache (und Krankenakten) interpretieren

Domenica 24 dicembre 2023

ca. 7 min. di lettura ⇆In deutscher Sprache

Fabio Crestani, Professor an der Fakultät für Informatik der Universität Lugano (Foto: Chiara Micci / Garbani)

Studien von Fabio Rinaldi (SUPSI) und Fabio Crestani (USI) über neue, mögliche Anwendungen des von ChatGPT und anderen Systemen verwendeten "large language model". Der Computer ist auch in der Lage, Gemütszustände zu entschlüsseln
di Simone Pengue

«ChatGPT, was ist ein large language model?» «Ein large language model ist ein Programm der künstlichen Intelligenz, das Texte ähnlich wie ein Mensch lesen, verstehen und schreiben kann, wie ich es jetzt bei der Beantwortung deiner Frage tue». Es hat etwas Faszinierendes, ChatGPT zu fragen, was man unter large language model (einem grossen Sprachmodell), versteht, weil es selbst ein hervorragendes Beispiel ist. Der Vollständigkeit halber sei erwähnt, dass es noch viele andere gibt, wie z. B. Bard von Google (das bald durch Gemini verstärkt wird), Claude von Anthropic oder Llama 2 von Meta (Facebook), das eher für experimentelle Zwecke gedacht ist. Ein Thema also, das aktueller denn je ist, wenn man bedenkt, wie sehr diese Systeme das tägliche Leben beeinflussen. So leistungsfähig und mitunter beeindruckend die grossen Sprachmodelle auch sein mögen, ihr Potenzial ist noch lange nicht ausgeschöpft, sowohl was die Anwendungen als auch was die Möglichkeiten angeht. In genau dieser Richtung sind zwei Forscher des Dalle Molle Instituts für Studien zur künstlichen Intelligenz (IDSIA) tätig: Fabio Rinaldi, der der SUPSI angehört, und Fabio Crestani, Professor an der USI.

Ingrandisci la foto Fabio Rinaldi Ingrandisci la foto

Um die Grenzen der Forschung in diesem Bereich zu verstehen, muss man sich jedoch zunächst eine Frage stellen, die wir uns vielleicht alle in den letzten Monaten gestellt haben: Wie versteht ein Computer die Bedeutung von Wörtern? Seit ChatGPT vor einem Jahr der Öffentlichkeit zugänglich gemacht wurde, hat man viel darüber gehört, wie es auf alle im Internet verfügbaren Texte, Bücher und Dokumente “ trainiert” wurde. Es ist jedoch nicht einfach zu verstehen, wie der Computer in der Lage ist, unsere Fragen mit grammatikalisch einwandfreien Sätzen und einem umfangreichen Wortschatz zu beantworten. «Der Irrtum besteht darin, zu glauben, dass der Computer den Wörtern die gleiche Bedeutung zumisst wie wir», erklärt Fabio Rinaldi. «Für den Computer sind Lesen und Schreiben nur eine statistische Assoziation. Wenn ich zum Beispiel schreibe “heute ist ein schöner... ”, kann er leicht vorhersagen, dass er das Wort “Tag” braucht, weil er diese Wörter in seinem Training schon oft zusammen gesehen hat. Das ist das Grundprinzip. Dann wird es natürlich mit weiteren Techniken verfeinert». Ein System, das, so verblüffend es auch sein mag, bislang nicht ohne Schwächen ist. Die bekannteste ist die Tendenz der grossen Sprachmodelle, Namen oder Tatsachen zu erfinden und sie gleichzeitig auf völlig überzeugende und plausible Weise zu präsentieren. Fabio Crestani präzisiert: «Das nennt man “Halluzinationen” und es wird sicherlich das nächste Problem sein, das die grossen Unternehmen der Branche zu lösen versuchen werden».

EINE PRAKTISCHE ANWENDUNG IM GESUNDHEITSWESEN - An der SUPSI erkundet Fabio Rinaldi derweil neue Wege zur Anwendung grosser Sprachmodelle auf den “logistischen” Apparat der Medizin durch das Lesen und Verwalten von Krankenakten. Der Forscher hat insbesondere mit dem Ente Ospedaliero Cantonale (EOC) an der Entwicklung von Systemen zur Anonymisierung und Kennzeichnung von Krankenakten gearbeitet. Fabio Rinaldis Kooperationen reichen mit dem vom Universitätsspital Lausanne (CHUV) koordinierten Projekt SwissMade, aber auch über den Gotthard hinaus. Im Rahmen von SwissMade haben sich Forscher aus vier Schweizer Spitälern das gemeinsame Ziel gesetzt, mithilfe von künstlicher Intelligenz mögliche Nebenwirkungen von in Kliniken eingesetzten Medikamenten zu erkennen. Die Berichte der Ärzte, die nach jeder Behandlung geschrieben werden, werden vom Computer ausgelesen und interpretiert. Der Computer versucht herauszufinden, ob ähnliche Nebenwirkungen bei verschiedenen Patienten aufgetreten sind, die Analogien aufweisen, z.B. bestimmte körperliche Voraussetzungen oder wenn andere Medikamente verabreicht werden. Auf diese Weise kann die Überwachung des Einsatzes von Arzneimitteln in grossen Mengen, die von Krankenhäusern verwaltet werden, die Forschung unterstützen.

In jüngster Zeit zielt auch das vom Schweizerischen Nationalfonds finanzierte Projekt QUADRATIC in enger Zusammenarbeit mit dem Institut für Pharmakologische Wissenschaften der Südschweiz und dem Bereich Informations- und Kommunikationstechnologie, ebenfalls vom EOC, auf eine systematische Verbesserung der Erkennung und Überwachung von unerwünschten Arzneimittelwirkungen (Nebenwirkungen) ab, was sich positiv auf die öffentliche Gesundheit und die Sicherheit von Arzneimitteltherapien auswirken könnte. «Diese Berichte von den Ärzten zu erhalten, sie zu analysieren und dann zu entscheiden, ob eine Beschreibung an die Zentralbehörde Swissmedic geschickt werden soll, ist eine zeit- und fachaufwendige Tätigkeit und daher sehr teuer», sagt Rinaldi. «Die Tatsache, dass sie so kostspielig ist, bedeutet, dass wir manchmal nicht alle möglichen unerwünschten Wirkungen erfassen, einfach weil uns die Zeit oder die Mittel fehlen».

DIE SPRACHE DER SOZIALEN MEDIEN ENTSCHLÜSSELN - Im USI-Labor von Fabio Crestani steht stattdessen der Nutzer im Mittelpunkt, der einen Text verfasst hat, z. B. einen Beitrag in einem sozialen Netzwerk, eine E-Mail oder eine Frage an die künstliche Intelligenz selbst. Durch die Art und Weise, wie sich eine Person ausdrückt, kann man ihre Stimmung oder ihr Profil verstehen. Schliesslich können auch wir erkennen, ob uns ein Freund eine fröhliche oder eine eher missmutige SMS schreibt, oder ob ein Facebook-Post von einer reifen Person oder einem Teenager verfasst wurde. Die gleichen Informationen können potenziell aus grossen Sprachmustern "extrahiert" werden. Eines der Ziele des Projekts, das Fabio Crestani zusammen mit Kollegen an der Universität Amsterdam durchführt, besteht darin, die Erfahrung bei Interaktionen mit künstlichen Intelligenzen zu verbessern, indem dieses Wissen genutzt wird, um Tonfall, Sprache und Inhalt der Antwort anzupassen. Und nicht nur das: Die Algorithmen, die das Team entwickelt, sind auch in der Lage, dem Nutzer relevante Fragen zu stellen, um seine Bedürfnisse einzugrenzen. «Ein sehr einfaches Beispiel», erklärt Rinaldi, «könnte die Suche nach einem Restaurant sein, in dem man zu Abend essen kann: Bevor man eine Antwort erhält, wird das grosse Sprachmodell versuchen, aus dem Gespräch zu verstehen, welche Art von Essen wir mögen, unser Alter oder den Anlass des Ausgehens». Aber, um das Thema noch weiter zu fassen, «muss die Sprache», fügt Crestani hinzu, «auch an den sozialen und kulturellen Kontext der Menschen angepasst werden».

GEMÜTSZUSTÄNDE "LESEN" - Das Potenzial eines Computers, der in der Lage ist, über textuelle Ausdrucksformen ein Benutzerprofil zu erstellen, erstreckt sich auch auf sensible und grundlegende Bereiche wie die psychische Gesundheit. Im Rahmen des europäischen Makroprojekts Remo (Researcher mental health observatory, ”Observatorium für psychische Gesundheit der Forscher”) an dem Fabio Crestani mitwirkt, wird die Fähigkeit des Computers, den Geisteszustand des Schreibers zu lesen, zur Überwachung des psychischen Gesundheitszustands von Forschern genutzt. Die Interviews und Fragebögen, denen sich die Freiwilligen regelmässig unterziehen, werden sowohl von Soziologen und Psychologen als auch von der Maschine ausgewertet. Auf diese Weise wird die menschliche Erfahrung und Zuverlässigkeit durch die Fähigkeit grosser Sprachmodelle verbessert, kleine emotionale Risse im Lexikon und in der Syntax oder vielleicht subtile Verbindungen zwischen scheinbar unzusammenhängenden Situationen zu erkennen.

In ähnlicher Weise zielt das Projekt eRisk, das 2017 in Zusammenarbeit mit zwei spanischen Universitäten gestartet wurde, auf die Früherkennung von Symptomen psychischen Unwohlseins wie Depressionen, Angstzuständen oder Essstörungen in Beiträgen in sozialen Netzwerken ab. Sobald das System einsatzbereit ist, können Systeme entwickelt werden, die der betroffenen Person helfen oder präventive Funktionen erfüllen.

So kann die künstliche Intelligenz unsere Sprache (und Krankenakten) interpretieren

Studien von Fabio Rinaldi (SUPSI) und Fabio Crestani (USI) über neue, mögliche Anwendungen des von ChatGPT und anderen Systemen verwendeten "large language model". Der Computer ist auch in der Lage, Gemütszustände zu entschlüsselndi Simone Pengue

Studien von Fabio Rinaldi (SUPSI) und Fabio Crestani (USI) über neue, mögliche Anwendungen des von ChatGPT und anderen Systemen verwendeten "large language model". Der Computer ist auch in der Lage, Gemütszustände zu entschlüsseln
di Simone Pengue