Nel nostro mondo accademico molto competitivo, dove chi vuole avere delle possibilità di fare carriera deve mostrare di avere prodotto molte pubblicazioni, sta diventando sempre più macroscopica la presenza di articoli costruiti su dati fasulli, oppure cloni di altri articoli, magari degli stessi autori. Visto che due articoli valgono più di uno, gli autori che hanno bisogno di pubblicare copiano se stessi, una pratica diventata così tristemente comune che gli editori delle riviste scientifiche si sono dotati di software antiplagio che riconoscono paragrafi o capitoli già apparsi in altre pubblicazioni.

Ma la disponibilità delle applicazioni di intelligenza artificiale ha aperto un altro fronte: i testi che si vogliono “duplicare” possono essere riscritti con l’ausilio dell’IA, alla quale viene chiesto di dire le stesse cose con parole diverse. Ovviamente l'IA non ha chiaro dove fermarsi nella parafrasi e arriva a coniare definizioni diverse e “tortuose” degli stessi concetti, veri e propri giri di parole che possono essere usati per smascherare la frode proprio grazie all’uso dell’intelligenza artificiale (qui alcuni esempi tratti da un pezzo di commento di Nature dell’anno scorso)

È quindi compito degli editori di riviste o dei controllori dell’integrità scientifica andare in profondità e decidere se l’articolo è inventato oppure no. Ovviamente questo è solo un esempio: visto che l’IA è diventata molto brava a costruire immagini, bisogna anche controllare le figure, sempre chiedendo all'IA di riconoscere quelle “costruite” da quelle vere.

I controlli dovrebbe essere fatti prima della pubblicazione ma, a volte, sono i lettori che si accorgono che qualcosa non va e segnalano la cosa alla rivista che, dopo i controlli, decide di ritirare il lavoro. Le frodi possono essere di diversa entità, dal ritocco di una figura all’invenzione dei dati sui quali è basata una ricerca e, purtroppo, ogni tanto si scoprono casi di persone che hanno sistematicamente costruito i dati che hanno poi pubblicato. Un comportamento inqualificabile che ha conseguenze ben peggiori della ritrattazione dei lavori, visto che i responsabili vengono licenziati e pesantemente sanzionati.

La frode non è l’unica ragione per ritirare un articolo: succede che gli autori si accorgano, a posteriori, di avere fatto qualche errore, oppure può accedere che un risultato, magari presentato con grande enfasi, risulti non riproducibile da altri gruppi di ricerca. Quando si ammette o si sospetta la presenza di un errore l’articolo viene ritirato. È successo di recente con la “scoperta” della superconduttività a temperatura ambiente, un risultato potenzialmente fantastico che, però, non ha potuto essere replicato in modo indipendente.

Mentre le ritrattazioni di risultati importanti ricevono attenzione, quelle per duplicazione o per costruzione dei dati sono diventate un basso continuo, al momento di proporzioni limitate ma, ahimè, in continua crescita, come è evidente dal grafico, pubblicato su Nature, che mostra l’evoluzione del numero di lavori ritirati negli ultimi dieci anni.

Il contributo maggiore al picco del 2023 (e il conteggio copre fino all’8 dicembre) viene dalla riviste Hindawi che hanno ritirato 8000 articoli. Sembra che la maggior parte sia apparsa negli special issue, numeri extra, rispetto alla rivista cui fanno capo, gestiti da editori ospiti che erano diventati un veicolo efficace e veloce per pubblicare articoli di scarsa qualità e più o meno copiati, oltre che una fonte di guadagno per la casa editrice. Il problema aveva assunto proporzioni così macroscopiche che Hindawi, alla fine del 2022, ha deciso sospendere la pubblicazione dei numeri speciali nonostante un danno economico stimato tra i 35 e i 40 milioni di dollari.

Alla fine la Hindawi è scomparsa, assorbita dalla casa madre Wiley, che si è impegnata a tenere molta alta la guardia, anche se gli introiti mancati pesano e il portavoce della casa editrice ha detto: «Special issues continue to play a valuable role in serving the research community». Certo sono valuable per le case editrici che tempestano i ricercatori con richieste del tipo «vuoi fare l’editor di un numero speciale su un argomento a tua scelta?». In questo modo, una persona in cerca di notorietà diventa guest editor e convince amici e colleghi a scrivere articoli per i quali bisognerà pagare costi di pubblicazione su un giornale con impact factor modesto ma non nullo, dal momento che ogni articolo ne cita molti altri perché anche le citazioni sono un parametro importante.

Ritirare gli articoli truffa non mette la parola fine al problema, dal momento che gli articoli non scompaiono ed è sempre possibile che vengano citati. Gli 8000 articoli ritirati da Hindawi contano 35.000 citazioni. Per fortuna, stiamo parlando di una percentuale piccola della produzione scientifica mondiale, diciamo intorno allo 0,2% ma i numeri si sono triplicati negli ultimi dieci anni. Se andiamo a vedere le nazioni i cui scienziati hanno pubblicato più di 100.000 articoli negli ultimi vent'anni, scopriamo che l’Arabia Saudita ha il record del numero di articoli ritirati con 30 ogni 10.000. Se invece si considerano anche gli articoli pubblicati alle conferenze, il record va alla Cina, con la stessa percentuale di lavori ritirati. Tra le case editrici, la IEEE, originariamente Institute of Electrical and Electronics Engineers ma ora una organizzazione che gestisce conferenze (con i volumi dei Proceedings a esse associati) di grandi dimensioni in moltissimi campi, è quella a più alto tasso di ritrattazioni.

Visto che è sempre valida la massima “prevenire è meglio che curare”, gli sforzi sono concentrati sullo sviluppo di metodi per riconoscere gli articoli truffaldini ed evitarne la pubblicazione. Chi studia il problema delle truffe nella scienza sa che esistono le paper mills, letteralmente fabbriche di articoli alle quali gli autori possono rivolgersi per comperare un articolo preconfezionato, ovviamente falso oppure copiato in modo più o meno fantasioso. Secondo gli esperti, le paper mills hanno prodotto centinaia di migliaia di articoli, cosa che fa supporre che i 50.000 articoli ritirati fino a oggi siano la punta dell’iceberg di un problema molto più grande.