I ricercatori della Duke-NUS Medical School hanno scoperto migliaia di sequenze di DNA nel genoma umano che codificano per microproteine e peptidi che possono svolgere un ruolo importante nella salute e nelle malattie umane.
“Molto di ciò che capiamo sul 2% del genoma codificato per le proteine viene dalla ricerca di lunghi filamenti di sequenze nucleotidiche codificanti proteine o lunghi frame di lettura aperti“, ha spiegato Sonia Chothani, biologa computazionale, ricercatrice presso il Cardiovascular Diseases Program e Metabolic (CVMD) di Duke-NUS e autore principale del nuovo studio. “Tuttavia, gli scienziati hanno recentemente scoperto piccoli frame di lettura aperti (smORF) che possono anche essere tradotti dall’RNA in piccoli peptidi, che hanno ruoli nella riparazione del DNA, nella formazione muscolare e nella regolazione genica“.
I ricercatori hanno cercato di identificare gli smORF e i piccoli peptidi che codificano, poiché l’interruzione degli smORF può causare malattie. Tuttavia, le tecniche attualmente disponibili sono piuttosto limitate. “Molti degli attuali set di dati non forniscono informazioni sufficientemente dettagliate per identificare gli smORF nell’RNA“, ha avvertito Chothani. “La maggior parte proviene anche da analisi di cellule umane immortalate che vengono propagate, a volte per decenni, per studiare la fisiologia, la funzione e la malattia delle cellule. Tuttavia, queste linee cellulari non sono sempre rappresentazioni accurate della fisiologia umana.”
La ricerca
Chothani e ricercatori di Singapore, Germania, Regno Unito e Australia hanno presentato l’approccio creato per affrontare queste sfide in un nuovo studio pubblicato su Molecular Cell. Hanno analizzato i set di dati di profilazione del ribosoma esistente per brevi filamenti di RNA con sezioni periodiche a tre basi che coprivano oltre il 60% della lunghezza dell’RNA. Hanno quindi eseguito il loro sequenziamento e la caratterizzazione del ribosoma per stabilire un set di dati combinato di sei tipi di cellule e cinque tipi di tessuto da centinaia di pazienti.
Le analisi hanno identificato circa 8.000 smORF. È interessante notare che erano altamente specifici per i tessuti in cui sono stati trovati, il che significa che questi smORF possono svolgere un ruolo specifico per il loro ambiente. Il team ha anche identificato 603 microproteine codificate da alcuni di questi smORF. “Il genoma è pieno di smORF“, ha affermato Owen Rackham, autore principale dello studio. “La nostra mappa completa degli smORF umani mette in evidenza i componenti funzionali trascurati del genoma, individua nuovi attori nella salute e nelle malattie e fornisce una risorsa per la comunità scientifica come piattaforma per accelerare la scoperta“.
Patrick Casey, ricercatore presso Duke-NUS, ha aggiunto che “con il sistema sanitario in evoluzione non solo per curare le malattie ma anche per prevenirle, l’identificazione di potenziali nuovi obiettivi per la ricerca sulle malattie e lo sviluppo di farmaci potrebbe aprire nuove strade per nuove soluzioni”.
“Questa indagine del dott. Chothani e il suo team, pubblicato come risorsa per la comunità scientifica, apportano importanti spunti sul campo”, conclude.