null

magazine_ Article

DNA: il software sviluppato a Bolzano che ha rivoluzionato la ricerca

Si basa sul processo di imputazione ed è ormai la tecnologia standard utilizzata nella ricerca sulle cause genetiche delle malattie a livello mondiale

Michal_Bednarek
Credit: Photocreo Bednarek - stock.adobe.com | Michal_Bednarek | All rights reserved
by Laura Defranceschi

Sequenziare il genoma di un singolo individuo è una pratica molto complessa dal punto di vista computazionale. Lo strumento sviluppato da Eurac Research e Università medica di Innsbruck permette di studiare il genoma sequenziandone solo una parte: in questo modo i costi si riducono anche di 50 o 100 volte e i ricercatori possono sequenziare molto più velocemente il genoma di enormi quantità di persone. Ecco perché oggi il software ha un ruolo di primo piano nella ricerca genetica mondiale.

Il consorzio TOPMed, con sede a Washington negli Stati Uniti, è il più ampio programma mondiale per la ricerca sulla medicina di precisione. Finora ha sequenziato oltre 53.000 genomi di persone di origini diverse, in buona salute o affette da malattie che fanno parte della popolazione generale statunitense. Sequenziare il genoma significa decodificare le basi che lo compongono per “leggere” le informazioni contenute nel DNA. Questo ampio studio coinvolge più di 30 gruppi di ricerca e indaga le cause genetiche dei disturbi cardiaci, polmonari, del sangue e le problematiche legate al sonno. I risultati che ha raggiunto sono di notevole importanza: mentre 2,6 miliardi di basi sono identiche in tutti i genomi degli esseri umani, i ricercatori hanno identificato 400 milioni di varianti, cioè punti in cui il DNA è diverso in ogni singolo individuo. Sulla base di questi dati, ora i ricercatori possono approfondire i fattori di rischio genetici di alcune malattie con l’obiettivo di migliorarne la diagnosi, il trattamento e la prevenzione.

Per proseguire la ricerca oggi il consorzio può contare su un nuovo metodo che velocizza il sequenziamento utilizzando l’imputazione: si tratta di una procedura matematica che permette di esaminare solo una parte del genoma, il resto viene "compilato" o estrapolato da un software. Questa novità è nata in Alto Adige. Il bioinformatico Christian Fuchsberger di Eurac Research ha creato l’algoritmo alla base del software e lo ha sviluppato insieme ai colleghi dell’Università medica di Innsbruck. Grazie a questo sistema, non si riducono solo i tempi del sequenziamento, ma diminuiscono anche i costi. L’alternativa a questo metodo è infatti il Next Generation Sequencing, una tecnica molto precisa che richiede enormi capacità di calcolo e costa circa mille euro a genoma. Il risultato della procedura di imputazione non è accurato come quello di un sequenziamento di questo tipo, tuttavia la probabilità con cui vengono determinati i punti del genoma è estremamente alta e i costi sono inferiori anche di 50 o 100 volte, si tratta quindi di un grande aiuto per gli scienziati. Per queste ragioni il consorzio TOPMed ha deciso di utilizzare il software per proseguire la ricerca e condividere i suoi dati con altri gruppi di ricerca nel mondo. Si è rivolto quindi all'Istituto di biomedicina di Eurac Research e all'Istituto di epidemiologia genetica dell'Università medica di Innsbruck, le due istituzioni lavorano da anni nel campo dei big data e gestiscono uno dei più utilizzati servizi web di bioinformatica che supportano l’analisi dei dati genetici.

Christian FuchsbergerCredit: Eurac Research

Il software sviluppato dagli esperti altoatesini e tirolesi ha attirato l’attenzione dei gestori dei più noti programmi per l'analisi del DNA già dalla sua pubblicazione, nel 2016. Queste aziende lo hanno integrato nei loro sistemi e così il team di Bolzano e Innsbruck ha iniziato a contribuire ai più importanti studi al mondo sulle malattie genetiche. Oggi gli esperti hanno perfezionato la tecnologia in modo che i ricercatori possano accedere al servizio direttamente dai loro computer, prima non era possibile perché per utilizzare il software era richiesta un’enorme capacità computazionale. Hanno inoltre collegato il software a enormi banche dati – con i dati genetici di 97.000 persone al momento quella di TOPMed è la più ampia – in modo che i ricercatori possano completare nel modo più accurato possibile le loro analisi genomiche parziali senza sequenziare per intero ogni singolo genoma. Sono sempre più numerosi i consorzi che si rivolgono a Fuchsberger e colleghi per integrare i loro dati nel software. Per questo la protezione e la sicurezza dei dati sono particolarmente importanti: “Nel processo di imputazione tutti i dati rimangono segreti. Abbiamo fatto in modo che i gruppi di ricerca potessero ottenere il sequenziamento dei propri dati, senza mai accedere ai dati grezzi degli altri studi raccolti nel database” conclude Fuchsberger.

Al momento, il server su cui si basa il servizio web è costituito da oltre 1.500 processori che eseguono calcoli in parallelo. Finora sono 1.200 le istituzioni del mondo della ricerca che hanno approfittato del servizio web, sequenziando grazie all’imputazione i genomi di oltre 13 milioni di persone. E questi numeri continuano a crescere: gli esperti di Eurac Research e dell’Università medica di Innsbruck lavorano al software per migliorarlo sempre di più e adeguarlo alle esigenze dei grandi gruppi di ricerca internazionali.

Link al server di imputazione (come è stato predisposto per TOPMed): https://imputation.biodatacatalyst.nhlbi.nih.gov/#!


Related Content

Eurac Research Magazine