Il riconoscimento automatico della personalità di un individuo da un suo testo scritto è una sfida che ha iniziato ad appassionare la comunità scientifica solo di recente, a partire dai primi pionieristici tentativi dopo l’esplosione del fenomeno dei blog. Sotto i riflettori da un paio d’anni sono invece i social media, come twitter e facebook, che costituiscono un’enorme risorsa di dati e di informazioni di ogni tipo sugli utenti che li utilizzano in tutto il mondo (circa l’86% degli adulti sul web, secondo l’istituto privato di studi politici, economici e sociali americano Pew Research Center). La sola comunità di Facebook costituisce la terza nazione al mondo, dopo Cina e India.
Le analisi che si possono compiere sui testi estratti dal web riguardano la personalità degli autori che li hanno redatti. Possono essere utili in ambito forense, per la rilevazione delle menzogne, ma anche in psicologia e per chi studia le strategie di diffusione di un prodotto o di un’idea tramite il passaparola virtuale, il cosiddetto “marketing virale”.
«Studiando le interazioni su Twitter, abbiamo rilevato che gli utenti emotivamente stabili hanno interazioni forti, nel nostro caso conversazioni, con una cerchia ristretta di utenti; invece, gli utenti classificati come nevrotici tendono ad avere interazioni deboli, cioè che spesso non ricevono risposta, e cercano di conversare con utenti più lontani nella rete, come se non riuscissero a stabilizzare i legami conversazionali e ne cercassero di nuovi. In questo modo, i nevrotici mettono in piedi delle reti comunicative che, per quanto deboli, permettono ad un potenziale messaggio o idea di diffondersi più facilmente», spiega Fabio Celli del Laboratorio Linguaggio, Interazione e Computazione (CLIC Labs) del Centro Interdipartimentale Mente/Cervello (CIMeC) dell’Università di Trento che sull’argomento ha appena pubblicato con la prestigiosa casa editrice tedesca Lambert un manuale dal titolo “Adaptive Personality Recognition from Text”.
Il potersi concentrare sugli aspetti unicamente verbali della comunicazione, poter valutare il parlante ad ogni turno comunicativo e in diretta (tramite i tablet e ai vari dispositivi di supporto) è possibile grazie alla potenza delle nuove tecnologie, in grado di analizzare le enormi quantità di dati estratti dai grandi corpora di testo, senza le quali certe analisi richiederebbero decenni. «Il contributo delle tecnologie con le quali i dati vengono elaborati genera però dello scetticismo nei sociologi, abituati a lavorare con dati di tipo qualitativo. Eppure il loro coinvolgimento nell’interpretazione dei dati è essenziale, oggi più che mai» commenta Fabio Celli.
E’ noto che il nostro comportamento virtuale rivela molto di noi, delle nostre preferenze e delle nostre scelte. Insomma, della nostra personalità. Quella di creare un sistema automatico in grado di attribuire correttamente dei tratti di personalità sulla base di un testo scritto è un’impresa ancora agli inizi, anche se i risultati già ottenuti sono promettenti. Questi sistemi si basano sul modello “Big Five”, uno dei più diffusi e testati, che identifica cinque caratteristiche essenziali - nevroticismo, estroversione, apertura, amabilità, coscienziosità – sulla cui base fornire una descrizione dell’individuo. «Sono sistemi le cui prestazioni sono in continuo miglioramento, in termini di accuratezza e precisione», spiega Fabio Celli che è uno degli organizzatori del primo workshop sull’argomento, Workshop on Computational Personality Recognition (Shared Task), che si terrà l’11 luglio 2013 al Massachusetts Institute of Technology (MIT) di Boston. Il workshop, che si svolgerà all’interno del The International AAAI Conference on Weblogs and Social Media (ICWSM) dell’Association for the Advancement of Artificial Intelligence (AAAI), intende fare il punto sui traguardi ottenuti e le ricerche in corso e fornire un occasione di incontro e di dialogo agli scienziati di diversa formazione, tra cui linguisti, psicologi, esperti di computer science, e interazione uomo macchina, ingegneri, che condivideranno i risultati e gli strumenti più utili che emergeranno dal workshop, come base di partenza per future ricerche.
Università di Trento - CIMeC
