Quando il genoma umano è stato sequenziato quasi 20 anni fa, molti ricercatori erano fiduciosi di essere in grado di individuare rapidamente i geni responsabili di malattie complesse come il diabete o la schizofrenia. Ma si sono arrestati rapidamente, ostacolati in parte dalla loro ignoranza del sistema di interruttori che governano dove e come i geni sono espressi nel corpo. Tale regolazione genica è ciò che distingue una cellula cardiaca da una cellula cerebrale, ad esempio, e distingue i tumori dai tessuti sani. Ora, un massiccio sforzo decennale ha iniziato a riempire il quadro collegando i livelli di attività dei 20.000 geni umani codificanti proteine, come mostrato dai livelli del loro RNA.
Osservando fino a 54 tipi di tessuto in centinaia di persone decedute di recente, il progetto Genotype-Tissue Expression (GTEx) da 150 milioni di dollari si propone di creare “uno sportello unico per la genetica della regolazione genica”, afferma Emmanouil Dermitzakis, membro del team di GTEx. In una serie di articoli su Science, Science Advances, Cell e altre riviste scientifiche, i ricercatori di GTEx hanno pubblicato le grandi analisi finali di questi dati ora scaricabili gratuitamente, nonché gli strumenti per sfruttare ulteriormente i dati.
“Questa risorsa è inestimabile per chiunque sia interessato a particolari malattie o allo studio di tessuti o tipi di cellule”, afferma Jan Korbel, genetista umano presso l’European Molecular Biology Laboratory (EMBL). “È un tesoro pubblico”, dice Jun Li, genetista dell’Università del Michigan. Ma la complessa analisi principale ci fa capire quanto possano essere complesse le interconnessioni tra i geni e il loro DNA regolatore. I documenti “sono scritti in burocratese” e i risultati annunciati sono difficili da decifrare, afferma Dan Graur, biologo evoluzionista presso l’Università di Houston. E come altri critici, osserva che il progetto, con l’85% di donatori bianchi, manca gravemente di diversità e quindi mancherà la variazione genetica in altri gruppi.
GTEx non è ancora in grado di definire sequenze responsabili di malattie come malattie cardiache e insufficienza renale, né tracciare il modo in cui gli strati di regolazione genica lavorano insieme. “Non dovremmo fare le valigie e dire che l’espressione genica è risolta”, afferma il genomicista Ewan Birney, vicedirettore generale dell’EMBL, che ha guidato un altro grande progetto di genomica chiamato ENCODE.
I tessuti morti potrebbero aiutare nella ricerca genetica
Dopo il lancio di GTEx nel 2010, le famiglie di oltre 900 soggetti deceduti che avevano già impegnato i propri organi o tessuti per i trapianti hanno concordato che i ricercatori possono anche prelevare campioni dei tessuti sani dei loro cari, ad esempio cervello, muscoli, grasso, pancreas e cuore. Avere più tessuti dello stesso soggetto ha dato ai ricercatori la certezza che la variazione nell’espressione genica tra, diciamo, muscolo e pancreas, fosse reale e significativa. “Per la prima volta, abbiamo questo set omogeneo in modo da poter ottenere differenze biologiche tra i tessuti”, afferma Barbara Stranger, membro di GTEx, genetista della Northwestern University.
I ricercatori hanno descritto ogni campione, quindi hanno ripreso e congelato tutti i tessuti per analisi future. Hanno decifrato i genomi e quantificato l’RNA per misurare l’attività genica. Oltre a confrontare i tessuti all’interno di una persona, potrebbero anche confrontare lo stesso tessuto in individui diversi. Sono stati in grado di collegare le variazioni nel DNA ai livelli di espressione genica utilizzando analisi statistiche per trovare modelli correlati di cambiamento. Il cuore del database GTEx è una raccolta delle complesse relazioni tra tratti di DNA regolatorio chiamati loci dei tratti quantitativi di espressione, o eQTL, e i geni che regolano.
Una fase pilota, completata nel 2015, ha esaminato in profondità nove tessuti e ha dimostrato che i campioni di cadaveri erano ragionevoli sostituti del tessuto vivente, afferma il co-leader di GTEx Tuuli Lappalainen, genetista presso il New York Genome Center. Ora, dopo aver analizzato quasi 20.000 campioni, GTEx “ha raggiunto una dimensione in cui possiamo ottenere intuizioni molto più chiare e nitide”, afferma il co-leader Kristin Ardlie, genetista umano presso il Broad Institute. Lei e i suoi colleghi hanno scoperto che quasi tutti i geni umani sono regolati da almeno un eQTL, molti dei quali prendono di mira più geni e presumibilmente influenzano più tratti.
GWAS e GTEx insieme per identificare i singoli tratti genetici
Stranger ha scoperto un altro risultato chiave: quasi tutti i tessuti, inclusi, ad esempio, la pelle e il cuore, hanno mostrato differenze nell’espressione genica tra maschi e femmine. “La stragrande maggioranza della biologia è condivisa da maschi e femmine”, dice Stranger, ma le differenze di espressione possono aiutare a spiegare perché uomini e donne hanno diversi modelli di malattia o reazioni ai farmaci. “Lo considero una scoperta importante”, dice Korbel.
Allo stesso modo, il co-leader di Broad François Aguet e colleghi hanno confermato che alcuni eQTL estendono la loro portata a geni distanti, anche quelli su altri cromosomi. GTEx ha documentato 143 tali elementi “trans”, alcuni dei quali influenzano più geni in tutto il genoma. Kelly Frazer dell’Università della California, San Diego, sta già utilizzando i dati per aiutare a dare un senso ai cosiddetti studi di associazione a livello di genoma (GWAS), che pongono grandi misteri. In un GWAS, massicci consorzi esaminano i genomi di migliaia di pazienti con una particolare malattia o tratto e annotano centinaia di sottili cambiamenti genetici, spesso al di fuori dei geni stessi. Ma i ricercatori spesso non hanno idea di quale di questi molti sospetti scateni la malattia o modella il tratto.
Gli studi GWAS hanno identificato più di 500 variazioni genetiche che sembravano influenzare il ritmo cardiaco e la conduttanza elettrica. Frazer voleva sapere in che modo un fattore di trascrizione specifico del cuore chiamato NKX2-5 influenzava quei tratti. Il suo team aveva identificato migliaia di variazioni del DNA che potevano influenzare l’attività di NKX2-5 e quindi forse cambiare il ritmo cardiaco.
Paola Benaglio nel laboratorio di Frazer ha analizzato e confrontato le variazioni del DNA, i dati GWAS e i dati GTEx per identificare quali variazioni del DNA regolano effettivamente l’attività di NKX2-5. È stata in grado di restringere prima le eQTL candidate a 55, poi a nove e infine, utilizzando i dati GWAS sui ritmi cardiaci e altri strumenti, si è concentrata su una singola base variabile sul cromosoma 1. Successivamente, ha bloccato quella base del DNA usando il genoma redattore CRISPR e ha confermato che altera il legame NKX2-5, Benaglio, Frazer e i loro colleghi hanno riferito l’anno scorso su Nature Genetics.
“Sono sicuro che ci sono centinaia di persone come me che apprezzano il database”, afferma Frazer. Le statistiche la confermano. Ogni mese, 16.000 persone visitano il portale GTEx e altri esaminano i dati su altri siti. Nel 2018, 900 giornali lo hanno citato. Birney comprende l’entusiasmo, ma avverte che possono sorgere correlazioni spurie tra eQLT e geni. Graur, da parte sua, rimane scettico sul fatto che l’attività genica nei cadaveri rifletta adeguatamente ciò che sta accadendo nei vivi, nonostante i dati del team sulla conservazione dell’espressione genica.
Mentre il progetto si conclude, il National Institutes of Health degli Stati Uniti sta pianificando un GTEx evolutivo che arruolerà persone sotto i 20 anni per creare un atlante dell’espressione genica dalla nascita all’età adulta. I risultati finora non possono raccontare la storia completa di come il genoma dia origine alla miriade di tessuti e malattie di un essere umano. Tuttavia, secondo Birney, “GTEx verrà utilizzato e riutilizzato ancora e ancora, e ci saranno alcuni usi che non posso prevedere”.