Dirk Hovy, lo scienziato che fa i conti con la lingua
Un ex linguista che usa l'analisi statistica su larga scala per studiare le interazioni fra linguaggio e caratteristiche demografiche è l'ultimo acquisto del Dipartimento di Marketing della Bocconi. Si chiama Dirk Hovy e proviene dall'Università di Copenhagen. "Mai avrei pensato di entrare a far parte della faculty di un'università di livello internazionale nel campo dell'economia", dice. "Poi ho sentito parlare del nuovo Master of Science in Data Science and Business Analytics e la Bocconi è apparsa sul mio radar. Far parte del nuovo programma e contribuire a farlo decollare è un'esperienza entusiasmante". In Bocconi, Hovy sta insegnando Social Media Marketing. Con l'inizio del master, insegnerà anche Natural Language Processing, spiegando agli studenti i modi in cui i computer possono interagire con il linguaggio umano. Hovy ama cucinare ("un'attività che è in parti uguali esperimento scientifico ed esperienza sensuale"), ha la qualifica di istruttore di judo, scrive su dirkhovy.com e twitta su @dirk_hovy.
La scoperta del Natural Language Processing
Dirk Hovy si è laureato in linguistica nel 2006 all'Università di Marburg, nella nativa Germania. Dopo alcuni anni, si è però stancato dell'apparente arbitrarietà della teoria linguistica. "Un giorno ho scoperto per caso il Natural Language Processing. Era esattamente quel che volevo fare, anche se fino a quel momento non ne ero stato consapevole. Mi affascinava l'idea di insegnare ai computer a comprendere il funzionamento di una lingua". E così Hovy è passato dalla linguistica alla computer science, "scoprendo che le cose non erano così facili", aggiunge ridendo. Mentre i colossi dell'high-tech reclutavano i suoi amici, lui imboccava una strada completamente diversa frequentando la University of Southern California, prima come studente di PhD e poi come ricercatore presso l'Information Sciences Institute. "Volevo rimanere nel mondo accademico per cercare risposte alle grandi domande".
Dopo un post-dottorato presso il Center for Language Technology dell'Università di Copenhagen, Hovy è diventato professore associato nel Dipartimento di Computer Science della stessa università. È lì che ha sviluppato il suo interesse per le dimensioni sociali del linguaggio. "La lingua incorpora informazioni come sesso ed età, ma i computer non coglievano queste variazioni linguistiche. Non erano in grado di dire se eri nero o bianco, giovane o vecchio, perciò mi sono chiesto: possiamo insegnare ai computer a superare questo limite?". In altri due filoni di ricerca, Hovy usa computer e machine learning per identificare i fattori sociali più rilevanti nel produrre variazioni nel linguaggio e per far luce sulle implicazioni etiche degli algoritmi di tipo biased.
Il machine learning e le scienze sociali
Col tempo, Hovy ha intensificato le collaborazioni con scienziati sociali, dagli psicologi agli studiosi di marketing. "Sono gli accademici che pongono le domande davvero rilevanti sulla nostra società. La lingua è l'elemento che li unisce alle mie ricerche. Ogni volta che un testo è fonte d'informazione, ogni volta che cerchiamo di imparare qualcosa da esso, ecco che entra in gioco il Natural Language Processing. Può aiutarci a capire le abitudini d'acquisto dei consumatori, le modalità attraverso cui un'impresa assume i dipendenti o la popolarità di una startup".
La linguistica computazionale è un'area di ricerca in rapido mutamento. Negli ultimi anni, il potere di calcolo dei computer è aumentato notevolmente, così come le dimensioni dei data set. Nel frattempo, anche gli algoritmi diventavano sempre più complessi. "Oggi i computer, analizzando il linguaggio che utilizziamo, capiscono se siamo uomini o donne, o quanti anni abbiamo. Anzi, basandosi sul tuo profilo Twitter oggi è possibile determinare il luogo da cui provieni, con un margine d'errore di 10 chilometri". Le ultime riflessioni di Hovy riguardano l'uso del machine learning come strumento per rispondere alle domande poste dalle scienze sociali. "È una grande sfida. Per modellare fenomeni complessi, abbiamo bisogno di modelli complessi".
Per saperne di più
Adrian Benton, Margaret Mitchell, Dirk Hovy, Multitask Learning for Mental Health Conditions with Limited Social Media Data, in Proceedings of EACL, 2017.
Dirk Hovy, Shannon Spruit, The Social Impact of Natural Language Processing, in Proceedings of ACL short, 2016.
Dirk Hovy, Demographic Factors Improve Classification Performance, in Proceedings of ACL long, 2015.
Dirk Hovy, Taylor Berg-Kirkpatrick, Ashish Vaswani, Eduard Hovy, Learning Whom to Trust with MACE, in Proceedings of NAACL HLT, 2013.