fbpx Big Data: indietro nel tempo per ricostruire i linguaggi | Scienza in rete

Big Data: indietro nel tempo per ricostruire i linguaggi

Read time: 2 mins

Una ‘macchina del tempo automatica’, capace di ricostruire in poco tempo l’evoluzione dei linguaggi più antichi: è questo il risultato di un lavoro di ricerca di un team di scienziati di Berkley, in California, utile ai linguisti per fare sintesi tra le informazioni disponibili su centinaia di civiltà ancestrali.

La frontiera dei “Big Data” - ovvero quell’enorme quantità e aggregazione di dati oggi disponibile, gestibile con tecnologie avanzate – non riguarda solo il flusso di bit del web di files di testo, audio o video. La gestione dell’intero patrimonio di conoscenza raccolto può essere applicata anche a database tutt’altro che digitali, come dimostrano i ricercatori di Berkley che hanno messo a punto un programma e un sistema computerizzato che garantisce una ricostruzione veloce degli antenati dei linguaggi più moderni.
Il nuovo sistema computazionale californiano sfrutta un modello probabilistico  (il “Monte Carlo”, utilizzato abitualmente anche nelle ricostruzioni di modelli atomici in fisica teorica), per incrociare i vocaboli conosciuti con diverse radici semantiche relative a diverse lingue, ma con suono comune e origini ricollegabili tra di loro.
In ogni fase di calcolo dell’algoritmo, i percorsi evolutivi di linguaggi come il Proto-Indo Europeo o il Proto-Afroasiatico diventano più chiari. Questo programma è in grado, tuttavia, non solo di accelerare i processi di ricostruzione dei linguaggi più antichi su larga scala, ma, di conseguenza, facilita e completa la conoscenza che abbiamo sulle culture delle civiltà, basandosi sui loro vocabolari: una Big Data Analysis del passato.

“La cosa più entusiasmante del nuovo sistema sviluppato, è che vengono utilizzate molte delle idee già sviluppate dai linguisti circa la ricostruzione dell’evoluzione storica dei linguaggi, in modo inedito: più dati, più parole, più linguaggio, ma in meno tempo” – dichiara Dan Klein, professore associato di computer science all’università di Berkley e co-autore del paper pubblicato su PNAS.

La scoperta fatta a Berkley è un passo importante per la documentazione e gestione critica delle fonti storiche sul linguaggio e per tutelare la cultura e le conoscenze del passato. Infatti, mentre gli archeologi possono contare solo su fonti scritte, indagando il passato con un metodo comparativo, questo sistema consente di automatizzare l’analisi sulle relazioni tra linguaggi, con più alti livelli di certezza statistica.

La prossima ricostruzione in programma riguarda i proto-linguaggi delle popolazioni indigene del Nord-America.

 

Autori: 
Sezioni: 
Linguistica

prossimo articolo

La ricerca e l'innovazione dell'IA in mano a oligopoli privati: l’allarme e le soluzioni

L`intelligenza artificiale va regolamentata prima che si affermino forme di oligopolio, o persino di monopolio, capaci controllare l`accesso alle informazioni e la produzione di nuove conoscenze: per questo serve un grande centro di ricerca pubblico che oggi può essere realizzato solo in Europa. Lo afferma il premio Nobel per la fisica Giorgio Parisi in occasione del convegno ⁠ "Ricerca e democrazia nell`epoca delle Big Tech" ⁠ organizzato dal Gruppo 2003 per la ricerca scientifica il 14 maggio presso la sede del CNR a Roma, in collaborazione con Scienza in rete. Il dossier presentato dall'associazione sostiene con dati i rischi posti da un predominio economico schiacciante esercitato da poche aziende che valgono quanto il PIL degli USA, e che stanno condizionando profondamente anche l'ecosistema della ricerca scientifica, sempre meno aperto e controllato dalla comunità di riferimento. Nell'immagine Giorgio Parisi, foto di Luca Carra.

Sei aziende (NVIDIA, Alphabet, Apple, Microsoft, Amazon e Meta) valgono oggi circa 22.000 miliardi di dollari, tre quarti del PIL degli Stati Uniti. Nel solo 2026 spenderanno in infrastrutture digitali tra 660 e 725 miliardi di dollari, circa tre volte e mezzo il bilancio federale americano per tutta la ricerca civile.