Sino ad oggi abbiamo sequenziato e generato centinaia di migliaia di genomi umani moderni e migliaia di quelli antichi. Ma i diversi metodi utilizzati e la qualità dei diversi dati possono talvolta rendere molto complicati i confronti tra tutte queste migliaia di genomi umani, inoltre ogni genoma umano contiene segmenti di antenati di età diverse. Ma ora, grazie ad un nuovo studio, potremmo aver creato il più grande albero genealogico dell’essere umano mai esistito.

Nel suo studio Anthony Wilder Whons ed il suo team hanno infatti applicato un metodo di registrazione degli alberi genealogici ai genomi umani antichi e moderni sequenziati, per creare un albero genealogico unico dell’essere umano.

Questo metodo consente infatti di sopperire ai dati mancanti ed errati e utilizza genomi antichi per calibrare i tempi di coalescente genomico. Questo nuovo approccio ha permesso ai ricercatori di determinare come i nostri genomi sono cambiati nel tempo e tra le popolazioni, fornendo notevoli informazioni sulla storia e sull’evoluzione umana.

La difficile comparazione delle enormi quantità di dati esistenti

Sino ad ora tutti gli sforzi della scienza per sequenziare e caratterizzare il genoma umano ci hanno condotto alla conoscenza di molti aspetti del nostro passato evolutivo. Ora, con l’aumentare dei dati sul genoma umano e la creazione di biobanche su scala demografica, unite ai campioni antichi provenienti da tutto il mondo, aumentano anche le possibilità di comprendere in modo sempre più dettagliato come si siano evolute le popolazioni umane.

Come spiegano però i ricercatori nel loro articolo, i set di dati genomici sino ad ora raccolti, sono altamente eterogenei ed i campioni provenienti da epoche, posizioni geografiche e popolazioni diverse vengono elaborati, sequenziati e analizzati utilizzando le più varie tecniche. Tutto questo rende difficile la combinazione dei dati e ostacola la creazione di un quadro più completo della variazione genomica umana.

Ma da qualche parte, nascosta tra quelle miriadi di sequenze di DNA, c’è la storia dell’uomo e dalla sua evoluzione ed i ricercatori del Big Data Institute (BDI) dell’Università di Oxford nel Regno Unito potrebbero aver fatto un primo e significativo passo verso la sua scoperta.

La sequenza di alberi genealogici

Come spiegano i ricercatori nel loro articolo: “per affrontare queste sfide, utilizziamo la nozione fondamentale che le relazioni ancestrali di tutti gli esseri umani che siano mai vissuti possono essere descritte da una singola genealogia o sequenza di alberi [genealogici], così chiamata perché codifica la sequenza di alberi [genealogici] che collegano gli individui tra loro in ogni punto nel genoma. Questa sequenza ad albero dell’umanità è immensamente complessa, ma le stime della struttura sono un potente mezzo per integrare diversi set di dati e ottenere maggiori informazioni sulla diversità genetica umana.”

Questo metodo utilizza quella che è nota come una struttura di dati concisa, un concetto di calcolo che mira a rappresentare i dati in una quantità ottimale di spazio che limita anche la quantità di tempo necessaria per sondare tutto. In sintesi una sequenza di alberi genealogici trova correlazioni tra i diversi rami di un albero per facilitare lo studio di grandi serie di informazioni.

Trasformando dunque i dati in grafici con snodi e rami che rappresentano vari lignaggi e mappando le mutazioni, anche enormi database genetici possono essere compressi in uno spazio relativamente piccolo. Inoltre sarà più semplice analizzarli tramite algoritmi progettati per cercare statistiche interessanti.

Per dedurre questa genealogia unificata di campioni moderni e antichi, il team di ricercatori ha utilizzato metodi statistici e computazionali, convalidati attraverso una combinazione di simulazione al computer e analisi di dati empirici.

L’immenso albero genealogico dell’essere umano

Le loro ricerche hanno condotto ad una sequenza di alberi unificata di 3601 genomi moderni e otto sequenze di genoma umano antico, compilate da otto diversi set di dati. Tra questi vi sono anche tre genomi di Neanderthal, il genoma di un Denisovan e quelli di una piccola famiglia che visse in Siberia più di quattromila anni fa.

Questa sorta di gigantesco albero genealogico dell’essere umano è una rappresentazione compatta di 27 milioni di frammenti di aplotipi ancestrali e 231 milioni di lignaggi ancestrali che collegano i genomi indietro nel tempo. Per individuare e datare le relazioni sono stati utilizzate anche ulteriori 3589 campioni di antichi genomi umani, raccolti da oltre 100 pubblicazioni.

I ricercatori hanno anche inserito nell’albero genealogico delle etichette sulle posizioni geografiche delle sequenze. In questo modo sono riusciti a fare delle stime sui luoghi dove potrebbero aver vissuto alcuni nostri antenati e come si sono spostati.

Verso un nuovo capitolo dello studio dell’evoluzione umana

Questo nuovo studio dunque potrebbe aprire le porte per un nuovo capitolo dello studio dell’evoluzione umana. Questo albero genealogico, già di per sé mastodontico, ha infatti ancora molto spazio per crescere ed essere implementato, man mano che saranno disponibili nuovi dati genetici. Come affermano infatti i ricercatori nel loro studio, “l’aggiunta di altri milioni di genomi non farà altro che rendere più accurati ulteriori risultati, individuando esattamente dove una nuova sequenza si inserisce in una genealogia che si estende in tutto il mondo.”

Ph. Credit: Oxford Population Health, screenshot video Youtube