L’Intelligenza Artificiale per individuare gli “errori” genetici

08 novembre 2023

Di Serena Ricci

Il nostro DNA è come l’alfabeto. Come in un testo si può verificare un errore di battitura, meglio noto come mutazione missenso, in cui si verifica un cambiamento nucleotidico interessando una lettera del DNA. Le varianti missenso patogene interrompono la funzione delle proteine e riducono la forma fisica dell'organismo, mentre le varianti missenso benigne hanno effetti arginabili. Sono milioni le mutazioni possibili, alcune delle quali responsabili di patologie importanti. 


Una delle società di IA di Google, DeepMind, ha prodotto Alpha Missense, strumento importante per prevedere se le mutazioni genetiche sono potenzialmente patogene o meno nella ricerca sulle malattie rare. A differenza di Alpha Fold, modello di DeepMind che ha previsto la struttura di centinaia di milioni di proteine, Alpha Missense non fa previsioni sulla struttura di una proteina ma, basandosi su un database di DNA umano e di primate, è in grado di riconoscere quali mutazioni genetiche sono prevalenti. Quasi fosse un modello linguistico, quando gli viene sottoposta una sequenza proteica sbagliata se ne accorge. Il modello assegna un "punteggio di patogenicità" compreso tra 0 e 1 a ciascuna delle 71 milioni di possibili varianti missenso, e, aumentando il punteggio, aumenta la possibilità che una particolare mutazione causi o sia associata a una malattia. In tal modo il modello è stato in grado di classificare l’89% dei tipi di mutazioni missenso.


Jun Cheng, scienziato di Google DeepMind, coautore di un articolo di pubblicato su Science lo scorso settembre, spiega che, “se sostituiamo una parola di una frase in inglese, una persona che ha familiarità con la lingua, è in grado di capire immediatamente se le modifiche cambieranno o meno il significato della frase". Preziose le previsioni del modello Alpha Missense perché potrebbero aumentare il tasso di diagnosi delle malattie rare e consentire di trovare i nuovi geni coinvolti nelle patologie, favorendo lo sviluppo di nuovi trattamenti. Il modello non può ovviamente operare da solo e non avendo un addestramento specifico diretto a risolvere il problema delle varianti missenso, ma sulle proteine esistenti, il suo utilizzo potrebbe non essere limitato alle mutazioni, consentendo la comprensione dell'intero genoma e il modo in cui viene espresso. Secondo gli autori dell’articolo su Science, infatti, “Le previsioni Alpha Missense potrebbero illuminare gli effetti molecolari delle varianti sulla funzione delle proteine, contribuire all’identificazione di mutazioni missenso patogene e di geni patogeni precedentemente sconosciuti e aumentare la resa diagnostica di malattie genetiche rare.” Il modello è infatti in grado di identificare geni essenziali brevi che gli approcci statistici esistenti non sono in grado di rilevare.