Salta al contenuto principale

Condivisione di dati: Dati sulle Proteine

Condivisione di dati su COVID-19

Rendi i tuoi dati su COVID-19 accessibili al resto della comunità scientifica, rendendoli disponibili in database pubblici insieme ai rispettivi metadati.

Metadati

I metadati forniscono “dati sui dati”, cioè le informazioni di cui bisogna dotare un dataset per poterlo correttamente interpretare, gestire e conservare nel tempo. In quest’ambito i metadati generalmente includono informazioni sulla metodologia utilizzata per raccogliere i dati, informazioni sulle procedure strumentali, definizioni delle variabili utilizzate, unità di misura, indicazioni su il formato di file, il software utilizzato per raccogliere e/o elaborare i dati e altro ancora. Queste informazioni possono essere raccolte in semplici file di testo ed essere salvati in un archivio assieme al dataset.

I ricercatori sono fortemente incoraggiati ad utilizzare dei metadati standard, laddove siano presenti. È fortemente raccomandato iniziare a definire e raccogliere i metadati già dall’inizio del progetto di ricerca.

Nell’ambito della proteomica si suggerisce di utilizzare lo standard chiamato Minimum Information About a Proteomics Experiment (MIAPE) utilizzando i controlled vocabularies definiti dalla Proteomics Standards Initiative: PSI CVs.

Maggiori informazioni su standard e formati per metadati sono raccolti nella risorsa FAIRsharing.org.

Repositories

Per individuare la risorsa più adatta per condividere i dati, suggeriamo di utilizzare strumenti come FAIRsharing dove, utilizzando la keywordproteomics’, è possibile trovare una lista curata di repository per dati proteici.

Dati di interazione proteina-proteina

Per dati relativi ad interazioni proteina-proteina, a livello binario o a livello di network, si consiglia di utilizzare il database MINT. Le istruzioni per il caricamento dei dati possono essere trovate nella pagina dedicata.

Spettrometria di massa

Per dati prodotti tramite esperimenti di spettrometria di massa si consiglia di utilizzare il repository PRIDE fornito dal ProteomeXchange Consortium. Il caricamento dei dati può essere effettuato utilizzando PX Submission Tool.

Strutture proteiche

Questa classe comprende i dati di biologia strutturale di proteine e di altre macromolecole biologiche.

Per dati di cristallografia a raggi X e NMR si suggerisce di utilizzare il database Protein Data Bank in Europe (PDBE).

Per dati di microscopia elettronica e di tomografia si suggerisce di utilizzare il database Electron Microscopy Public Image Archive (EMPIAR).

Dati sensibili di biologia molecolare

Per dati di biologia molecolare prodotti a partire da sample umani che possono potenzialmente essere utilizzati per identificare uno specifico soggetto (e devono quindi essere protetti tramite accesso controllato) si consiglia di utilizzare lo European Genome-phenome Archive (EGA).

Per questa tipologia di dati è probabile che le singole istituzioni forniscano anche la possibilità di archiviazione presso un repository locale. Si suggerisce di mettersi in contatto con il proprio servizio di Data Management o IT per ottenere supporto.

Dati di biologia molecolare umani e virali correlati

Per dati di biologia molecolare che considerano in combinazione SARS-CoV-2 e il soggetto che ne è infettato (ES: studi di sequenziamento combinato del trascrittoma dell’ospite e del genotipo virale) si consiglia l’archiviazione presso un repository locale e la registrazione dei dataset presso il database BioSamples.


Repository Locali

Repository locali possono essere disponibili a livello di singola istituzione, università, istituto.

Suggeriamo di contattare il proprio servizio di Data Stewardship o servizio IT per avere maggiori informazioni a riguardo.

Segnalaci un Repository locale compilando questo form. Aumenta la tua visibilità, crea sinergie con altri laboratori e fai crescere l’impatto della tua ricerca.