fbpx Big Data: indietro nel tempo per ricostruire i linguaggi | Page 20 | Scienza in rete

Big Data: indietro nel tempo per ricostruire i linguaggi

Primary tabs

Read time: 2 mins

Una ‘macchina del tempo automatica’, capace di ricostruire l’evoluzione dei linguaggi più antichi: è questo il risultato di un lavoro di ricerca di un team di scienziati dell'Università della California di Berkley, e della British Columbia di Vancouver, utile ai linguisti per fare sintesi tra le informazioni disponibili su centinaia di civiltà ancestrali.

La frontiera dei “Big Data” - ovvero quell’enorme quantità e aggregazione di dati oggi disponibile, gestibile con tecnologie avanzate – non riguarda solo il flusso di bit del web o di files di testo, audio o video. La gestione dell’intero patrimonio di conoscenza raccolto può essere applicata, infatti, anche a database tutt’altro che digitali. I ricercatori di Berkley lo hanno dimostrato mettendo a punto un programma e un sistema computerizzato in grado di garantire una ricostruzione veloce delle protolingue, antenati dei linguaggi più moderni. Il nuovo sistema computazionale californiano sfrutta un modello probabilistico (il “Monte Carlo”, utilizzato abitualmente anche in biologia per le ricostruzioni di catene di DNA o in fisica teorica per i modelli atomici), che incrocia i vocaboli moderni con diverse radici semantiche, ma in cui si riconoscono suono comune e origini ricollegabili tra di loro.
In ogni fase di calcolo dell’algoritmo, i percorsi evolutivi di linguaggi come il Proto-Indo Europeo o il Proto-Afroasiatico diventano più chiari. Questo programma è in grado, tuttavia, non solo di accelerare i processi di ricostruzione dei linguaggi più antichi su larga scala, ma, di conseguenza, facilita e completa la conoscenza che abbiamo sulle culture delle civiltà, basandosi sui loro vocabolari: una Big Data Analysis del passato, insomma.

“La cosa più entusiasmante del nuovo sistema, è che vengono utilizzate molte delle idee già sviluppate dai linguisti circa la ricostruzione dell’evoluzione storica dei linguaggi, in modo inedito: più dati, più parole, più linguaggio, ma in meno tempo” – dichiara Dan Klein, professore associato di computer science all’università di Berkley e co-autore del paper pubblicato su PNAS.

La scoperta fatta a Berkley è un passo importante per la documentazione e gestione critica delle fonti storiche sul linguaggio e per tutelare la cultura e le conoscenze del passato. Infatti, mentre gli archeologi possono contare solo su fonti scritte, indagando il passato con un metodo comparativo, questo sistema consente di automatizzare l’analisi sulle relazioni tra linguaggi, con più alti livelli di certezza statistica (la ricostruzione di più di 600 lingue proto - austronesiane ha raggiunto un'accuratezza pari all'85%).

La prossima ricostruzione in programma riguarda i proto-linguaggi delle popolazioni indigene del Nord-America.

Autori: 
Sezioni: 
Free tag: 
Linguistica

prossimo articolo

Epidemie: una riflessione sulle cause e i rimedi

Un uomo punta l'obiettivo di una macchina fotografica verso alcuni uccelli in volo

Dall’hantavirus a Ebola, l’attenzione pubblica sulle epidemie resta alta: può essere utile allora una riflessione generale sulle modalità con cui si attiva la catena dei contagi. Partendo dall’hantavirus, Enrico Girardi, direttore scientifico dell’Istituto Spallanzani, delinea alcuni importanti fattori di rischio, che si manifestano in modo simile in qualsiasi emergenza epidemica, e indica quali sono i rimedi necessari, tra cui l’informazione. Crediti immagine: Dieny Portinanni su Unsplash

Passata l’emergenza legata all’hantavirus, il tema delle epidemie resta al centro dell’attenzione pubblica, a causa dell’esplosione del caso Ebola. Una riflessione più generale, articolata intorno a quello che è accaduto durante il recente focolaio di hantavirus, consente di mettere a fuoco fenomeni che si possono presentare in qualsiasi emergenza epidemica. La storia della recente epidemia di hantavirus contiene infatti tutti gli elementi che potrebbero essere utilizzati in una esercitazione sul contrasto alle malattie infettive emergenti.