Contatti

Morning Knowledge /5. Linguaggio

, di Fabio Todesco
Attraverso tecniche di machine learning, Dirk Hovy riesce a catturare le variazioni dialettali anche nel linguaggio usato sui social media. Ma che ruolo hanno oggi i dialetti nella formazione della nostra identita'?


Una nuova tecnica di machine learning ci permette di catturare le variazioni linguistiche e dialettali e la loro evoluzione attraverso l'analisi di ciò che le persone scrivono sui social media.

In due lavori recenti, Dirk Hovy, sociolinguista computazionale e professore associato presso il Dipartimento di Marketing della Bocconi, utilizza un metodo innovativo per elaborare grandi quantità di dati dei social media e cogliere differenze linguistiche. Il metodo fornisce un chiaro riferimento visivo (una mappa) che può servire come input per ulteriori studi qualitativi. Ha anche applicazioni dirette per la profilazione degli utenti (per scoprire dove si trova un utente di social media, per esempio).

L'algoritmo utilizza la tecnica delle reti neurali per derivare i modelli dai dati. All'inizio, l'algoritmo non sa nulla delle lingue parlate in Europa, ma osserva somiglianze linguistiche nei dati geolocalizzati, e li colloca in uno spazio a tre dimensioni. Ogni dimensione viene poi convenzionalmente definita come una quantità di rosso, verde e blu e ogni punto viene rappresentato come miscela di questi tre colori. I valori 0,5, 0,5, 0.5 e 0,5, ad esempio, corrispondono ad un grigio medio. Ne deriva una mappa d'Europa che coglie bene l'utilizzo delle diverse lingue in Europa.

Un altro studio applica la stessa tecnica ai dialetti tedeschi. I risultati contraddicono la percezione comune che i dialetti stiano scomparendo nella vita moderna. Pur non distinguendo più tra singole città, lo studio dimostra che i dialetti sono radicati a un livello regionale più ampio, anche su piattaforme anonime di social media, dove le persone dovrebbero avere pochi motivi per marcare la loro origine.

Nel 2020, pensate che i dialetti abbiano ancora un ruolo nella costruzione della nostra identità

The Colors of Our Online Language

Guarda il video