IDSIA

Così l’intelligenza artificiale
può interpretare il nostro
linguaggio (e le cartelle cliniche)

Lunedì 22 gennaio 2024 circa 7 minuti di lettura In deutscher Sprache
Fabio Crestani, professore ordinario alla Facoltà di scienze informatiche dell’Università della Svizzera italiana (foto di Chiara Micci / Garbani)
Fabio Crestani, professore ordinario alla Facoltà di scienze informatiche dell’Università della Svizzera italiana (foto di Chiara Micci / Garbani)

Studi di Fabio Rinaldi (SUPSI) e Fabio Crestani (USI) su nuove, possibili applicazioni del "large language model" utilizzato da ChatGPT e da altri sistemi. Il computer è in grado di decifrare anche gli stati d’animo
di Simone Pengue

«ChatGPT, che cosa è un large language model?» «Un large language model è un programma di intelligenza artificiale che può leggere, comprendere e scrivere testi in modo simile a un umano, come sto facendo ora rispondendo alla tua domanda». C’è qualcosa di affascinante nel chiedere a ChatGPT che cosa si intenda per large language model (modello linguistico di grandi dimensioni), perché esso stesso ne è un ottimo esempio. Per onor di cronaca va specificato che ne esistono molti altri, come Bard di Google (che tra poco sarà rinforzato da Gemini), Claude di Anthropic, o Llama 2 di Meta (Facebook), più rivolto a un utilizzo sperimentale. Un argomento quindi più che mai d’attualità, considerando quanto questi sistemi stiano travolgendo la vita di tutti i giorni. Per quanto potenti e, a volte, impressionanti, i modelli linguistici di grandi dimensioni sono ancora ben lontani dal proprio pieno potenziale, sia in termini di applicazioni che di capacità. È proprio in questa direzione che avanzano  due ricercatori dell’Istituto Dalle Molle di Studi sull’Intelligenza Artificiale (IDSIA): Fabio Rinaldi, affiliato alla SUPSI, e Fabio Crestani, professore all’USI. 

Ingrandisci la foto Ingrandisci la foto Fabio Rinaldi Ingrandisci la foto

Per capire quale sia la frontiera della ricerca in questo settore, però, bisogna prima porsi una domanda che, forse, ci siamo fatti tutti negli scorsi mesi: come fa un computer a capire il significato delle parole? Da quando ChatGPT è diventato disponibile al grande pubblico, un anno fa, si è sentito molto parlare di come sia stato “allenato” su tutti i testi, libri e documenti reperibili su internet. Non è però facile capire come faccia il computer a rispondere alle nostre domande con frasi grammaticalmente impeccabili e amplissimo vocabolario. «L’errore - spiega Fabio Rinaldi - è ritenere che il computer dia un significato alle parole nel modo in cui facciamo noi. Per il computer leggere e scrivere sono solo un’associazione statistica. Ad esempio, se io digito “oggi è una bella…”, gli è facile prevedere che ci voglia la parola “giornata”, perché nel suo allenamento ha visto queste parole assieme molte volte. Questo è il principio di base. Poi naturalmente viene raffinato con ulteriori tecniche». Un sistema che, per quanto stupefacente, per ora non è esente da difetti. Il più noto è la tendenza, da parte dei modelli di linguaggio di grandi dimensioni, di inventare nomi o fatti, pur presentandoli in maniera assolutamente convincente e plausibile. Fabio Crestani specifica che «si chiamano “allucinazioni” e saranno sicuramente il prossimo problema che le grandi aziende coinvolte nel settore cercheranno di risolvere».

UN’APPLICAZIONE PRATICA NEL MONDO DELLA SANITÀ - Intanto, alla SUPSI, Fabio Rinaldi esplora nuove direzioni per applicare i modelli di linguaggio di grandi dimensioni anche all’apparato “logistico” della Medicina attraverso la lettura e la gestione delle cartelle cliniche. In particolare, il ricercatore ha collaborato con l’Ente Ospedaliero Cantonale (EOC) allo sviluppo di sistemi per l’anonimizzazione e l’etichettatura delle cartelle cliniche.
Ma le collaborazioni di Fabio Rinaldi si sono spinte anche Oltregottardo con il progetto di SwissMade, coordinato dall’Ospedale Universitario di Losanna (CHUV). In SwissMade, i ricercatori di quattro ospedali svizzeri si sono dati l’obiettivo comune di individuare potenziali effetti collaterali dei farmaci utilizzati nelle cliniche, attraverso l’intelligenza artificiale. I referti dei medici scritti dopo ogni trattamento vengono letti e interpretati dal computer, che cerca di capire se effetti indesiderati simili sono comparsi a diversi pazienti con delle analogie tra loro, ad esempio condizioni fisiche particolari o in compresenza di altri farmaci. In questo modo, la sorveglianza dell’utilizzo dei farmaci nei grandi numeri gestiti dagli ospedali può dare un aiuto alla ricerca. 

Più recentemente anche il progetto QUADRATIC, finanziato dal Fondo nazionale svizzero per la ricerca scientifica, in stretta collaborazione con l’Istituto di Scienze Farmacologiche della Svizzera Italiana e l’Area Informatica e Tecnologia della Comunicazione, sempre dell’EOC, si propone l’obiettivo di migliorare in maniera sistematica la rilevazione e il processo di monitoraggio delle reazioni avverse (effetti collaterali) ai farmaci, con possibili ricadute positive in termini di salute pubblica e sicurezza delle terapie farmacologiche. «Ricevere questi referti dai medici, analizzarli e decidere poi se inviare una descrizione all’autorità centrale Swissmedic è un’attività - commenta Rinaldi - che richiede molto tempo e molte competenze specifiche, quindi è un’attività costosa. Il fatto che sia così onerosa fa sì che a volte non si riesca a cogliere tutte le possibili reazioni avverse, semplicemente per mancanze di tempo o di risorse».

DECIFRARE IL LINGUAGGIO DEI SOCIAL MEDIA - Nel laboratorio dell’USI di Fabio Crestani l’attenzione si concentra, invece, sull’utente che ha generato un testo, come un post di un social network, una mail o una domanda all’intelligenza artificiale stessa. Attraverso il modo in cui una persona si esprime è possibile capire il suo umore o il suo profilo. Dopotutto, anche noi riusciamo a capire se un amico ci scrive un messaggio in modo allegro o torvo, oppure se un post di Facebook è stato scritto da una persona matura o da un adolescente. Le stesse informazioni possono potenzialmente essere "estratte" dai modelli linguistici di grandi dimensioni. Uno degli obiettivi del progetto che Fabio Crestani sta portando avanti con alcuni colleghi dell’Università di Amsterdam è migliorare l’esperienza durante le interazioni con le intelligenze artificiali, utilizzando queste conoscenze per adattare tono, linguaggio e contenuto della risposta. Non solo: gli algoritmi che la squadra sta sviluppando sono anche in grado di porre a loro volta domande pertinenti all’utente in modo da circoscrivere le sue necessità. «Un esempio molto semplice - spiega Rinaldi - può essere la ricerca di un ristorante dove cenare: prima di darci una risposta, il modello di linguaggio di grandi dimensioni cercherà di capire dalla conversazione che tipo di cibo ci piaccia, la nostra età o l’occasione per l’uscita». Ma, allargando ulteriormente lo sguardo, «il linguaggio - aggiunge Crestani - va adattato anche al contesto sociale e culturale delle persone». 

"LEGGERE" GLI STATI D’ANIMO - Le potenzialità di un computer in grado di costruire il profilo dell’utente tramite i modi espressivi testuali raggiungono anche ambiti delicati e fondamentali quali la salute mentale. In un macro-progetto europeo chiamato Remo (Researcher mental health observatory, ”osservatorio della salute mentale dei ricercatori”) al quale Fabio Crestani contribuisce, le abilità del computer di leggere lo stato d’animo dello scrivente sono utilizzate per aiutare a monitorare lo stato di salute mentale dei ricercatori. Le interviste e i questionari a cui sono sottoposti periodicamente dei volontari vengono analizzate sia da sociologi e psicologi che dalla macchina. In questo modo l’esperienza e affidabilità dell’uomo è accresciuta dall’abilità dei modelli linguistici di grandi dimensioni di rilevare nel lessico e nella sintassi delle piccole crepe emotive, o magari dei legami sottili tra situazioni apparentemente sconnesse.

Similmente, il progetto eRisk, cominciato nel 2017 in sinergia con due università spagnole, mira a individuare i sintomi precoci di malessere psicologico come depressione, ansia o disturbi del comportamento alimentare all’interno dei post presenti nei social network. Una volta che il sistema sarà pronto, si potranno sviluppare dei sistemi per aiutare la persona interessata o per assolvere delle funzioni di prevenzione.