Si chiama AlphaFold, il programma di intelligenza artificiale sviluppato da DeepMind (filiale di Google AI) insieme all’Istituto europeo di bioinformatica dell’EMBL (European Molecular Biology Laboratory), e che permette di prevedere la struttura tridimensionale di una proteina dalla sua sequenza di amminoacidi. Un passo gigantesco nel risolvere una delle più grandi sfide della biologia.
Le proteine sono molecole biologiche fondamentali per il nostro organismo. Ne esistono migliaia, con forme e proprietà chimiche molto diverse fra loro, e tale differenza può essere ricondotta ad una sequenza lineare di amminoacidi. Gli amminoacidi che compongono le proteine sono sempre gli stessi – e sono venti – ma le diverse combinazioni e disposizioni spaziali danno vita a strutture tridimensionali con proprietà chimico-fisiche molto diverse.
La capacità di prevedere con precisione le strutture proteiche dalla loro sequenza di amminoacidi sarebbe un enorme vantaggio per le scienze della vita e la medicina. Consentirebbe di scoprire nuovi farmaci in maniera più rapida e avanzata: infatti, il primo passo verso lo sviluppo di un nuovo farmaco è l’individuazione di un bersaglio farmacologico, che in moltissimi casi è proprio una proteina.
Già da decenni la biologia strutturale, consentendo di “vedere” la struttura atomica delle proteine, è uno strumento importante, ma ora l’intelligenza artificiale può facilitare e accelerare ulteriormente il processo di “drug discovery”. Nelle varie fasi di sviluppo di un nuovo farmaco, infatti, si ha a che fare con un numero incalcolabile di possibili composti e l’applicazione dell’intelligenza artificiale può rendere più veloce ed efficiente la ricerca del candidato ideale da testare in laboratorio, riducendo tempi e costi.
Idealmente, questo approccio prevede la modellazione di come milioni di sostanze chimiche interagiscono con le regioni chiave della proteina bersaglio, nella speranza di identificare composti che alterino l’attività della proteina stessa. Questo è ciò che è stato fatto, per esempio, in un recente studio: i ricercatori hanno utilizzato lo strumento di previsione della struttura proteica AlphaFold per identificare centinaia di migliaia di potenziali nuove molecole che potrebbero aiutare a sviluppare nuovi tipi di antidepressivi.1
Ma non tutti sono così ottimisti riguardo alla rivoluzione di AlphaFold nella scoperta dei farmaci – almeno – non ancora. In un articolo pubblicato su eLife, un gruppo di scienziati dell’Università di Stanford in California ha dimostrato che l’abilità di AlphaFold nel prevedere le strutture proteiche non si traduce ancora in solidi indizi per il legame dei ligandi. “Modelli come AlphaFold sono davvero ottimi con le strutture proteiche, ma dobbiamo riflettere su come usarli per la scoperta di farmaci”, afferma Masha Karelina, biofisica di Stanford e coautrice dell’articolo.2
Ma DeepMind non si è fermata qui, creando anche AlphaMissense, un modello di apprendimento automatico in grado di analizzare le varianti missenso – che comportano, cioè, la sostituzione di un singolo amminoacido – e di prevedere la probabilità che causino una malattia con un’accuratezza del 90%, più alta degli strumenti attualmente esistenti. Pur essendo basato su AlphaFold, lo strumento funziona in maniera diversa, è più simile a un modello linguistico – addestrato alle sequenze proteiche – alla base dei sistemi di intelligenza artificiale, come ChatGPT.
AlphaMissense analizza gli effetti delle mutazioni del DNA e potrebbe accelerare la ricerca sulle malattie rare. Il modello ha assegnato un “punteggio di patogenicità” compreso tra 0 e 1 a ciascuna delle 71 milioni di possibili varianti missenso, in base alle sue conoscenze sugli effetti di altre mutazioni strettamente correlate: più alto è il punteggio, più è probabile che una particolare mutazione causi o sia associata a una malattia.3
La speranza è che, così come AlphaFold sta dando nuovo slancio a settori come la scoperta di farmaci o la cura del cancro, AlphaMissense aiuti i ricercatori in diversi campi ad accelerare la ricerca sulle mutazioni genetiche, consentendo di diagnosticare più rapidamente le malattie e di trovare nuove terapie.
Fonti
1https://www.nature.com/articles/d41586-024-00130-8
2https://elifesciences.org/reviewed-preprints/89386v1
Ringraziamenti