Le proteine sono davvero fondamentali per la vita umana, tanto da essere definite come servi della vita. Per funzionare al meglio queste file di amminoacidi si attorcigliano, si piegano e si intrecciano in forme complesse impossibili avvolte da decifrare. Gli scienziati da anni hanno sognato di prevedere la forma di una proteina dalla sua sequenza di amminoacidi.
Diversi mesi fa alcuni biologi computazionali hanno dimostrato che l’intelligenza artificiale può prevedere con precisione le forme delle proteine. Questo metodo funziona non solo su proteine semplici, ma anche su complessi di proteine. Il team lo ha già utilizzato per modellare più di 4500 sequenze proteiche presentate da altri ricercatori.
L’intelligenza artificiale è in grado di riconoscere la proteina
Nell’autunno del 2020, DeepMind, una società di intelligenza artificiale con sede nel Regno Unito di proprietà di Google, ha entusiasmato il campo con le sue previsioni sulla struttura in una competizione biennale . Chiamato “Valutazione critica della previsione della struttura proteica“, il concorso utilizza strutture appena determinate utilizzando tecniche di laboratorio laboriose come la cristallografia a raggi X come parametri di riferimento. Il programma AlphaFold2 ha fatto cose davvero straordinarie, predicendo le strutture proteiche con precisione atomica.
Ispirandosi a questo precedente approccio, quello nuovo utilizza la capacità dell’intelligenza artificiale di discernere modelli in vasti database di esempi, generando iterazioni sempre più informate e accurate man mano che apprende. Uno confronta la sequenza di amminoacidi della proteina con tutte le sequenze simili nei database di proteine. Un altro prevede le interazioni a coppie tra gli amminoacidi all’interno della proteina e un terzo compila la presunta struttura 3D. Il programma rimbalza tra le tracce per perfezionare il modello, utilizzando l’output di ciascuna per aggiornare le altre.
Tutti e due questi processi cambieranno il modo in cui possiamo utilizzare le previsioni sulla struttura delle proteine per progredire con la biologia. Questo nuovo approccio è in grado come già detto di funzionare su strutture più complesse, come la struttura della molecola immunitaria interleuchina-12 attaccata al suo recettore. La capacità di gestire i complessi proteina-proteina direttamente dalle informazioni sulla sequenza lo rende estremamente interessante per molte domande nella ricerca biomedica.
Foto di Gerd Altmann da Pixabay