I principi della “Scienza Aperta” per contrastare le pandemie: la condivisione dei dati genomici dei patogeni
Pubblicato: 27 April 2022
L’interpretazione dei dati derivati dal sequenziamento, tuttavia, dipende in larga parte dal confronto dei dati stessi con banche dati di sequenze preesistenti o dall’utilizzo di strumenti d’analisi i cui modelli interpretativi si basano su sequenze di “riferimento”; per questa ragione la condivisione dei dati di sequenziamento è un aspetto chiave della ricerca scientifica.
Qui si ripercorrono brevemente i principi alla base della condivisione dei dati di sequenziamento, ponendo particolare attenzione alla casistica riguardante le sequenze genetiche di organismi patogeni. Il sequenziamento del genoma di questi ultimi, infatti, è diventato uno strumento fondamentale per il monitoraggio delle malattie infettive e, per questa ragione, la condivisione di tali dati rappresenta un aspetto fondamentale tanto per la ricerca quanto per gli enti che si occupano della tutela della salute pubblica.
Il testo riprende le argomentazioni esplicitate in un “white paper”, non ancora pubblicato, firmato da alcuni prestigiosi scienziati di fama internazionale e consultabile al seguente link.
Nel corso degli anni le tecniche di sequenziamento, complici anche una maggiore disponibilità dei mezzi tecnologici e una progressiva diminuzione dei costi, hanno conosciuto uno straordinario sviluppo, divenendo parte integrante ed imprescindibile di diversi protocolli di analisi nei più disparati ambiti della ricerca biomedica e della pratica clinica. Tra questi ha acquisito una sempre maggiore importanza lo studio degli organismi patogeni, cioè di quegli agenti biologici capaci di determinare l’insorgenza di malattie nell’organismo da essi infettato.
La pandemia da COVID-19 ha messo ulteriormente in evidenza l’importanza del sequenziamento del genoma degli agenti patogeni per far luce sui loro meccanismi evolutivi. Ad esempio, la condivisione dei dati ottenuti dal sequenziamento del genoma di SARS-CoV-2 si è dimostrata fondamentale per contrastare la diffusione di nuove varianti del virus, sottolineando ulteriormente la necessità di collaborazione tra i diversi enti che si occupano dello studio di tali fenomeni. In particolare, per garantire una risposta rapida ed efficace ad emergenze di tale portata si rende necessaria una maggiore sinergia tra le organizzazioni che si occupano della salvaguardia della salute pubblica e quelle coinvolte nella ricerca. Entrambe queste realtà, infatti, pur interessandosi spesso ad aspetti diversi della ricerca sui patogeni e sulla malattie infettive, basano parte della propria attività sull’analisi dei dati di sequenziamento e dei metadati ad essi correlati e sull’utilizzo di strumenti e protocolli dedicati: per tale ragione la condivisione e lo scambio di dataset e metodi tra queste due realtà andrebbe a beneficio dello sviluppo di entrambe.
Di seguito vengono discusse brevemente alcune delle necessità e delle problematiche delle quali è indispensabile tener conto nel discutere della libera condivisione dei dati di sequenziamento:
- Rapidità di condivisione. La rapidità con cui i dati di sequenziamento sono resi disponibili deve tener conto delle necessità dei diversi ambiti della ricerca (e.g. la sorveglianza genomica delle varianti richiede che i dati siano disponibili nel minor tempo possibile, idealmente in tempo reale; al contrario lo studio dei meccanismi d’azione di agenti patogeni non circolanti richiede una minor urgenza nella condivisione).
- Standardizzazione dei dati. La definizione di formati e linee guida standardizzati per la condivisione delle sequenze genetiche è indispensabile per facilitare il loro utilizzo interdisciplinare. Nel caso dei dati di sequenziamento dei patogeni gli enti di salute pubblica e la ricerca dovrebbero interfacciarsi per stabilire degli standard comuni che rendano il processo di condivisione dei dati più semplice ed organico.
- Tipologia dei dati da condividere. Dal momento che gli strumenti della bioinformatica sono indispensabili per l’analisi dei dati di sequenziamento e possono includere differenti approcci e metodologie, è preferibile condividere le sequenze in forma di dati non processati (raw data) in modo da permettere all’utente finale di applicare il metodo che più si addice allo scopo della propria ricerca. Per la medesima ragione è auspicabile la condivisione, insieme alle sequenze, di quante più informazioni contestuali (note anche con il nome di metadati) indispensabili per stabilire se e come i dati possano essere riutilizzati. Tra i metadati figurano: metodiche e piattaforme di sequenziamento, eventuali analisi preliminari compiute sui campioni, informazioni spazio-temporali riguardanti la raccolta del campione, informazioni anagrafiche e/o sullo stato di salute del paziente da cui il campione è stato prelevato etc.
- Regolamentazione della condivisione dei dati. Gli enti produttori di dati devono necessariamente sottostare alla legislazione in materia di condivisione dei dati dei Paesi nei quali operano. Nonostante la definizione di convenzioni, regolamenti e leggi sia indispensabile per garantire che queste informazioni vengano trattate nella maniera più corretta e sicura, le differenze legislative in merito sono varie e possono andare ad acuire ulteriormente il divario fra paesi ad alto reddito e paesi a medio-basso reddito.
- Accesso agli strumenti e alle risorse per l’analisi dei dati. La possibilità di accedere ai dati di sequenziamento condivisi rappresenta solo un primo passo. Tuttavia, non è sempre possibile avere facilmente accesso agli strumenti (sia hardware che software) e/o alle competenze che permettono di analizzare e riutilizzare tali informazioni, aspetto che costituisce un ulteriore motivo di disuguaglianza tra diversi paesi del mondo.
- Promozione della condivisione dei dati. La validità del lavoro di un ricercatore è, ancora oggi, valutata principalmente attraverso il numero di pubblicazioni che ha prodotto. Talvolta, però, ciò comporta un ritardo nella condivisione dei dati generati dalla ricerca, i quali vengono resi pubblici solo dopo la pubblicazione del corrispondente articolo su una rivista scientifica. Nonostante la comunicazione dei risultati ottenuti rimanga un aspetto fondamentale della ricerca scientifica, il suo utilizzo come metro di valutazione quasi esclusivo della bontà di un progetto tende a sottovalutare la complessità della ricerca stessa. Una rivoluzione completa di tale mentalità, che vada a valorizzare la produzione e condivisione dei dati, rappresenterebbe un importante stimolo ad una più rapida ed “aperta” condivisione delle sequenze.
In conclusione, dunque, si ribadisce come una più ampia e libera circolazione dei dati di sequenziamento, prodotti tanto dalla ricerca di base quanto da enti che si occupano della salvaguardia della salute pubblica, rappresenti un aspetto quanto mai fondamentale per monitorare in maniera efficace la circolazione dei diversi patogeni nel mondo e per acquisire una maggior consapevolezza dei loro meccanismi d’azione e diffusione. In particolar modo si sottolinea come questo aspetto possa fare la differenza nel corso di un’emergenza globale come quella causata dalla circolazione di SARS-CoV-2, durante la quale una pronta divulgazione dei dati di sequenziamento riguardanti il virus rappresenta un fondamentale tassello nel rafforzamento e nella preparazione di meccanismi di sorveglianza e di risposta.
Fonte:
“Pathogen genomics data sharing: public health meets research”. Cochrane et al. March 17th 2022, doi: 10.5281/zenodo.6368839 (preprint)