Un progetto USI selezionato tra i Research Partnership Grants 2025 del Leading House MENA

daabc68ad5c6eda1e1bcce5ba12095ef.jpg

Servizio comunicazione istituzionale

11 dicembre 2025

Un progetto avanzato dalla Facoltà di scienze informatiche dell’USI è stato inserito tra i 13 selezionati a livello internazionale dal Leading House for the Middle East and North Africa (LHMENA) nell’ambito dei Research Partnership Grants 2025, a fronte di oltre 150 candidature provenienti da 15 Paesi e 36 istituzioni svizzere (rating di accettazione dell'8,6%). Il finanziamento, della durata di sei mesi, permetterà di avviare una collaborazione scientifica con il Cyber Security Group di NYU Abu Dhabi su un tema emergente: come gli stili linguistici dei modelli di intelligenza artificiale possano veicolare forme sottili di inganno, disinformazione o manipolazione.

Il progetto selezionato, dal titolo Tracing Deception and Misinformation Heuristics in LLMs via Causal Neural Circuit Discovery, è stato presentato dall'Assistente con dottorato Francesco Sovrano e vede la partecipazione di Michele Guerra e del Prof. ordinario Marc Langheinrich per l’USI, insieme alla Prof.ssa Christina Pöpper di NYU Abu Dhabi.

Il punto di partenza della ricerca è un interrogativo cruciale: nei grandi modelli linguistici (LLM), quali sono le euristiche – cioè le scorciatoie cognitive apprese – che governano gli stili di risposta, e in quale parte del modello risiedono? Il progetto nasce dall’evidenza che gli LLM non influenzano gli utenti solo tramite i contenuti, ma anche attraverso il modo in cui li presentano: toni e stili possono enfatizzare, semplificare, sovraccaricare o orientare il lettore indipendentemente dalla correttezza fattuale. Proprio perché lo stile non è una “bugia”, ma una forma, esso spesso sfugge agli strumenti di fact-checking tradizionali.

L’iniziativa si propone di adattare tecniche recenti di causal interpretability, inizialmente sviluppate per modelli aritmetici, allo studio del linguaggio naturale in due lingue — inglese e arabo — con l’obiettivo di individuare i circuiti neurali che determinano specifici stili ingannevoli. Il progetto prevede inoltre la definizione di un Deceptive Style Index (DSI), utile per confronti cross-lingua e per rendere misurabili rischi e vulnerabilità.

Oltre all’aspetto metodologico, la ricerca affronta implicazioni di sicurezza rilevanti. Attori malevoli possono infatti manipolare gli stili attraverso il prompt design, ottenendo output più persuasivi in contesti quali phishing, propaganda unilaterale o “information dumping”. Il rischio risulta particolarmente accentuato nelle lingue meno rappresentate nei dataset, come l’arabo, dove l’asimmetria dei dati può indurre modelli meno stabili e più facilmente manipolabili.

Il programma di lavoro prevede:
– la costruzione di un dataset multilingue con e senza manipolazioni stilistiche;
– la scoperta e validazione causale dei circuiti che controllano tali stili;
– studi di crowd-sourcing per identificare indizi visibili e potenziali euristiche;
– test di attenuazione selettiva dei circuiti per valutare se lo stile ingannevole può essere ridotto preservando le capacità del modello.

Tutti i materiali — dataset, metriche, codice e documentazione — saranno rilasciati in open access, a supporto di una collaborazione duratura tra Svizzera ed Emirati Arabi Uniti (UAE) e di un ecosistema di ricerca trasparente e riproducibile.

Secondo il Leading House MENA, inoltre, l’alto numero e la qualità delle proposte ricevute rappresentano “un forte segnale della creatività e della solidità della comunità scientifica globale”. L’inclusione del progetto USI tra quelli finanziati conferma la rilevanza internazionale delle competenze dell’ateneo nei campi dell’AI safety, della cybersecurity e dell’interpretabilità dei modelli.