fbpx Come Covid-19 cambia i meccanismi di pubblicazione e di validazione dei dati | Scienza in rete

Come Covid-19 cambia i meccanismi di pubblicazione e di validazione dei dati

Primary tabs

Tempo di lettura: 10 mins

La pandemia, e con essa la ricerca sul virus, ha profondamente modificato le procedure con cui la ricerca biomedica viene realizzata e comunicata: per esempio, con l'esplosione delle pubblicazioni preprint, per le quali in generale le valutazioni sembrano essere state positive. Potrebbero rappresentare il futuro delle pubblicazioni scientifiche?

Crediti immagine: Background photo created by mrsiraphol - www.freepik.com

Lo stato di emergenza provocato dallo scoppio della pandemia dovuta al virus SARS-CoV-2 ha avuto (e avrà ancora, almeno nel prossimo futuro) una serie di conseguenze su piani differenti. Fra i più rilevanti possiamo annoverare quelli sociale ed economico, forse anche quello politico; ci sono però anche altri effetti, meno appariscenti ma altrettanto rilevanti.

Uno di questi riguarda la produzione, circolazione e validazione dei dati scientifici. L’enorme impulso che la ricerca sul virus ha avuto negli ultimi dodici mesi e gli importanti risultati raggiunti, che hanno, tra l’altro (anche se non è l’unico aspetto da prendere in considerazione), permesso lo sviluppo e la verifica di vaccini in tempi mai visti in precedenza, hanno profondamente modificato le procedure con cui la ricerca biomedica viene realizzata e comunicata. Queste modificazioni potrebbero non essere transitorie né riguardare solo la biologia e la terapia dei virus. Proviamo ad analizzare qualche aspetto della questione.

Vari articoli sulle principali riviste internazionali hanno descritto il fenomeno dell'esplosione della pubblicazione dei risultati come preprint su vari archivi online, con un abbandono abbastanza sensazionale della consolidata e considerata intoccabile pratica di pubblicare i dati che si rispettino solo su riviste che li sottopongano al meccanismo di referaggio da parte di esperti del settore, la peer review. Uno di questi articoli, uscito su Nature a giugno 2020, ha messo l’accento soprattutto sui benefici della velocità di pubblicazione di open science. In generale, molti commenti vanno nella direzione di una valutazione positiva di un fenomeno che pare destinato a durare anche dopo a fine della pandemia.

Vale la pena, per capire meglio cosa sta succedendo, dedicare un po’ di attenzione al fenomeno degli archivi di preprint. Questi archivi non sono una novità, in quanto usati da tempo come mezzo di diffusione dell’informazione scientifica dalle comunità di ricercatori di varie discipline, in particolare dai fisici e dai matematici. Una delle ragioni di questa pratica è la maggiore inclinazione di questi ricercatori a condividere rapidamente i loro risultati sta forse nel fatto che in queste discipline in molti casi si tratta di lavori con centinaia o più firme, che quindi raccolgono il contributo di una vasta parte di un settore di ricerca (si veda la fisica), oppure riguardano contributi molto specialistici. In questa situazione, la competizione (e la relativa selezione) per pubblicare sulle riviste con più alto ranking per ricevere maggiore attenzione (e attirare maggiori finanziamenti) è meno forte che nel caso della ricerca biomedica, dove lo status di un ricercatore o di un gruppo di ricerca dipende quasi esclusivamente dai parametri bibliometrici elaborati dalle grandi aziende (private) come Web of Science, che analizzano quasi esclusivamente articoli di riviste che applicano un meccanismo di peer review. Vediamo un po’ più in dettagli alcuni di questi archivi. Parlerò solo dei tre più noti che riguardano (anche) le scienze biomediche, ma ce ne sono molti altri.

arXiv.org

È forse il più antico, fondato nel 1991, e fino a non molto tempo fa utilizzato soprattutto da fisici e matematici, poi anche con una sezione Quantitative Biology. È stato acquisito dalla Cornell University. Qui una breve descrizione, presa dal sito del sistema bibliotecario dell’Università di Torino:

ArXiv (pronunciato come la parola inglese archive) è un archivio per bozze definitive ("pre-prints") di articoli scientifici in fisica, matematica, informatica e biologia accessibile via Internet. In molti settori della matematica e della fisica, la maggior parte delle pubblicazioni scientifiche sono inserite in questo archivio. Nel giugno 2010, ArXiv.org conteneva più di 610 000 documenti, con circa cinquemila nuovi aggiunti ogni mese Sviluppato da Paul Ginsparg nel 1991, dapprima era ospitato sul server del Los Alamos National Laboratory nello stato del Nuovo Messico (all'indirizzo xxx.lanl.gov, da cui il suo precedente nome, archivio di preprint LANL); attualmente è proprietà della Cornell University (nello stato di New York) con mirror in varie parti del mondo. Nel 1999 ha cambiato il suo nome e indirizzo in ArXiv.org per garantire una maggiore flessibilità. L'esistenza di ArXiv è stato uno dei fattori scatenanti dell'attuale scontento nei confronti dei metodi tradizionali di comunicazione scientifica, sfociato nell'open access movement, che sostiene la necessità di superare il sistema fondato sulla pubblicazione su riviste scientifiche tradizionali, per accedere alle quali è necessario pagare un abbonamento. Parecchi matematici e fisici teorici pubblicano i loro lavori su arXiv prima di sottoporli a riviste tradizionali, per consentire un libero accesso da parte di tutta la comunità scientifica ed anche per ricevere commenti e pareri dai colleghi di tutto il mondo.

Area disciplinare: Fisica Matematica Informatica Biologia
Accesso: Libero
Editore: Cornell University

Informazioni prese dal sito dell’archivio:

arXiv is a free distribution service and an open-access archive for 1,830,062 scholarly articles in the fields of physics, mathematics, computer science, quantitative biology, quantitative finance, statistics, electrical engineering and systems science, and economics. Materials on this site are not peer-reviewed by arXiv. Important: e-prints posted on arXiv are not peer-reviewed by arXiv; they should not be relied upon without context to guide clinical practice or health-related behavior and should not be reported in news media as established information without consulting multiple experts in the field.

Se si fa una ricerca usando la parola chiave generica Biology si trovano: 33.719 articoli (950 dal 1991 al 2000, 7850 fino al 2010). Si vede comunque come negli ultimi dieci anni l’utilizzo di questo sito da parte dei biologi sia aumentato enormemente.

MedRxiv

Gestito dai Cold Spring Harbors Laboratories, dal British Medical Journal e dall’Università di Yale. Lanciato nel giugno 2019, quindi molto recentemente, è diventato il principale archivio di preprint biomedici. Contiene circa 16.000 preprints, più circa 110.000 di BioRxiv. Avviso sul sito:

medRxiv is receiving many new papers on coronavirus SARS-CoV-2. A reminder: these are preliminary reports that have not been peer-reviewed. They should not be regarded as conclusive, guide clinical practice/health-related behavior, or be reported in news media as established information.

Citiamo anche BioRxiv, sito gestito dai Cold Spring Harbors Laboratories e lanciato nel 2013, che è in realtà inglobato in Medrxiv.

La diffusione delle informazioni su Covid-19

Non si tratta, come si vede, di iniziative nate fuori dall’ambiente accademico mainstream; anzi della loro comparsa sono responsabili anche case editrici scientifiche “tradizionali”. È evidente la preoccupazione di evitare che quanto pubblicato su questi siti possa essere considerato come dato definitivo, utilizzabile per la pratica clinica o per la diffusione nei media; tuttavia, molti osservatori concordano col dire che questo canale ha decisamente contribuito alla rapida diffusione e propagazione dell’informazione scientifica e ha accelerato l’accumulo di conoscenze che ha portato alla realizzazione di (si spera efficaci) approcci terapeutici.

Vediamo, con un’analisi assolutamente sommaria, come il fenomeno a contribuito alla diffusione di informazione scientifica su Covid-19. L’andamento delle pubblicazioni censite da Pubmed, che censisce esclusivamente articoli pubblicati su rivista, può essere così riassunto:

   
Parola chiave “COVID-19”   
   
   
   
Articoli   
   
Di cui review   
   
24 giugno 2020   
   
25.783   
   
2.272   
   
24 agosto 2020   
   
43.087   
   
4.464   
   
30 gennaio 2021   
   
97.266   
   
10.900   

Gli archivi (considerando solo i più noti):

   
   
   
arXiv   
   
BioRxiv-MedRxiv   
   
24 giugno 2020   
   
1.318 dal maggio 2020
   
   
   
5.757 dal gennaio 2020   
   
24 agosto 2020   
   
1.928   
   
7.982 (6305 medRxiv + 1677 bioRxiv)   
   
31 gennaio 2021   
   
3.165   
   
12.774 (9.929 medRxiv + 2.845 bioRxiv)   

Si può notare come gli articoli depositati in questi archivi (che, ripetiamo, non sono tutti) siano una frazione di quelli già comparsi su riviste con peer-review. Gli stessi osservatori di cui parlavamo prima sostengono però che sono proprio questi preprint che hanno favorito l’accelerazione della ricerca sul virus, grazie anche al fatto che tutti sono open access. Il nuovo approccio non è peraltro arrivato inaspettato. Il movimento per l’open access da anni aveva messo al centro della discussione la necessità che i dati fossero disponibili a tutti, e non solo a chi aveva accesso alle riviste, i cui abbonamenti sono di solito molto costosi e non sono nella disponibilità di molte biblioteche, in particolare nei paesi meno ricchi. Questa giusta rivendicazione ha in realtà portato a esiti abbastanza complicati e in arte divergenti: da parte alla proliferazione di riviste open access che accettano lavori senza costi per gli autori ma sono di bassa qualità, dall’altra a costi elevati per chi vuole pubblicare nel formato open access (questo sia su riviste di alta reputazione, sia su altre meno affidabili, dove lo scambio è: paga per avere una peer review poco più che formale).

Da tempo, alcuni dei più importanti enti finanziatori a livello internazionale hanno raccolto la sfida, richiedendo che i gruppi che ricevono il finanziamento pubblichino solo articoli open (il cosiddetto “Plan S”). La pandemia, con la spinta a una rapida messa in comune dei risultati, unita a una possibile crisi dei bilanci degli enti di ricerca e delle case editrici, potrebbe accelerare il processo. E mentre molti pensano che i preprint messi sugli archivi in questo frenetico periodo siano più dei bollettini dal fronte che lavori scientifici accurati, il cui valore sia in grado di resistere nel tempo, questa spinta sta già modificando le regole del gioco del meccanismo di pubblicazione mainstream. Molte case editrici, come PLOS, eLife, the UK Royal Society and Hindawi, hanno creato un’iniziativa che prevede la formazione di un pool di scienziati disponibili a referaggi rapidi di lavori su Covid-19 e a mettere in comune i giudizi. I ricercatori posso avere un referaggio dei loro articoli ancora prima di sottoporli alle riviste: i preprints e i commenti sono pubblicati su BioRxiv e vengono poi inviati alla rivista. Altri ricercatori si sono impegnati a recensire i preprints pubblicati sugli archivi, mettendo i loro giudizi accanto agli articoli. Questi esempi indicano che il sistema di peer review può funzionare anche fuori dallo schema finora gestito dalle case editrici, e potrebbe rappresentare il futuro delle pubblicazioni scientifiche.

Alcuni commenti si spingono oltre, fino ad affermare che “tutti gli articoli dovrebbero essere prima dei preprint”. Un esempio citato è quello di un lavoro su immunità da cellule T e coronavirus, che aveva importanti implicazioni per lo sviluppo dei vaccini, messo sul sito Research Square (un altro archivio) il 17 giugno. Nei più di tre mesi che hanno preceduto la sua pubblicazione su Nature Immunology, è stato scaricato 100.000 volte e pare abbia raggiunto 10 milioni di contatti su Twitter, contribuendo così a rendere rapidamente disponibile informazioni cruciali. In prospettiva, secondo l’autore, la review post-pubblicazione potrebbe garantire l’affidabilità dei risultati scientifici altrettanto bene del vecchio sistema.

In realtà gli articoli affissi sugli archivi sono soggetti a un filtro preliminare per evitare casi evidenti di plagio o di pseudoscienza. Altri servizi accessori stanno nascendo per il referaggio dei preprints; ad agosto l’MIT Press ha lanciato Rapid Reviews: Covid-19, un sito che ospita recensioni e segnalazioni di lavori particolarmente rilevanti. Altre istituzioni ed enti hanno servizi simili.

I social media possono essere di aiuto in queste nuove procedure: un esempio è stato il caso di due lavori, pubblicati su Lancet e su il New England Journal of Medicine, basati su ricerche della azienda privata Surgisphere. Nel giro di pochi giorni sono circolati i commenti di molti ricercatori che denunciavano i dati come fraudolenti; una campagna su Twitter ha portato ad una lettera firmata da decine di ricercatori con critiche documentate, e i due articoli sono stati ritirati. In questo caso, la post-publication review ha funzionato per articoli pubblicati con il metodo canonico a riviste di alto profilo! Anche la National Library of Medicine, che finora aveva catalogato solo articoli tradizionali, ha cominciato a catalogare preprints relativi a ricerche sul Covid-19 finanziate dai National Institutes of Health.

Sicuramente le regole del gioco stanno cambiando. Certo è che in questo come in altri casi, l’accelerazione dei processi comporta molti benefici ma anche grossi rischi. Staremo a vedere.

 

Articoli correlati

Scienza in rete è un giornale senza pubblicità e aperto a tutti per garantire l’indipendenza dell’informazione e il diritto universale alla cittadinanza scientifica. Contribuisci a dar voce alla ricerca sostenendo Scienza in rete. In questo modo, potrai entrare a far parte della nostra comunità e condividere il nostro percorso. Clicca sul pulsante e scegli liberamente quanto donare! Anche una piccola somma è importante. Se vuoi fare una donazione ricorrente, ci consenti di programmare meglio il nostro lavoro e resti comunque libero di interromperla quando credi.


prossimo articolo

Perché le reti neurali hanno vinto i Nobel per la fisica e la chimica?

Quest'anno l'Intelligenza Artificiale ha fatto la parte del leone nei Nobel per la fisica e la chimica. Meglio sarebbe dire machine learning e reti neurali, grazie al cui sviluppo si devono sistemi che vanno dal riconoscimento di immagini alla IA generativa come Chat-GPT. In questo articolo Chiara Sabelli racconta la storia della ricerca che ha portato il fisico e biologo John J. Hopfield e l'informatico e neuroscienzato Geoffrey Hinton a porre le basi dell'attuale machine learning.

Immagine modificata a partire dall'articolo "Biohybrid and Bioinspired Magnetic Microswimmers" https://onlinelibrary.wiley.com/doi/epdf/10.1002/smll.201704374

Il premio Nobel per la fisica 2024 è stato assegnato a John J. Hopfield, fisico e biologo statunitense dell’università di Princeton, e a Geoffrey Hinton, informatico e neuroscienziato britannico dell’Università di Toronto per aver sfruttato strumenti della fisica statistica nello sviluppo dei metodi alla base delle potenti tecnologie di machine learning di oggi.