Contatti

Un nuovo strumento rileva le emozioni nei post dei social media in italiano

, di Fabio Todesco
Federico Bianchi, Debora Nozza e Dirk Hovy hanno rilasciato un pacchetto gratuito per la sentiment analysis e il riconoscimento delle emozioni in italiano, superando i limiti linguistici ed economici di strumenti simili

"Troppo contenta del mio nuovo X-Corp Xd817!". Si tratta di un felice outlier o di un'opinione rappresentativa dei clienti della X-Corp?

Le aziende di opinion mining e brand management ora eseguono abitualmente l'analisi del sentiment sui social media per capire quali aspetti di un marchio sono percepiti positivamente o negativamente dai clienti. Nel migliore dei casi, strumenti di intelligenza artificiale monitorano autonomamente i social media per identificare e classificare in pochi secondi le conversazioni su un brand. Nel caso peggiore, il compito deve ancora essere faticosamente condotto a mano.

Strumenti più avanzati sono in grado di identificare non solo il semplice sentiment, ma emozioni più sfumate (rabbia, gioia, tristezza, ecc.) espresse in un testo. Tuttavia, una grave limitazione della maggior parte di questi strumenti è che funzionano bene in inglese ma altre lingue, compreso l'italiano, sono state in qualche modo trascurate. Poiché la sentiment analysis è diventata un mercato in forte espansione, questi strumenti sono di solito anche piuttosto costosi. Tempi difficili per le piccole startup italiane che vogliono monitorare il loro successo online.

Federico Bianchi, Debora Nozza e Dirk Hovy, del Data and Marketing Insights (DMI) della Bocconi, un'unità di ricerca del centro BIDSA, hanno ora rilasciato FEEL-IT, un pacchetto per la sentiment analysis e il riconoscimento delle emozioni in italiano. Il data set e il modello sono liberamente disponibili sul web e descritti in un paper accademico, peer-reviewed, che sarà presentato lunedì 19 aprile a WASSA 2021, l'11° Workshop on Computational Approaches to Subjectivity, Sentiment & Social Media Analysis. Lo strumento (una libreria Python open-source disponibile qui) è capace di realizzare sia la sentiment analysis, sia il riconoscimento delle emozioni.

I ricercatori hanno analizzato e classificato manualmente più di 2.000 tweet in italiano da una serie di trending topic di Twitter, che coprono una moltitudine di temi, e hanno addestrato il loro sistema su questi tweet. Le emozioni rilevate nei tweet erano rabbia, gioia, paura e tristezza. I ricercatori hanno poi testato la qualità delle previsioni del loro sistema su una serie di commenti di video musicali e pubblicità pubblicati su YouTube e Facebook.

"I nostri test mostrano che i risultati sono notevoli", spiega Nozza, "Con i dati di alta qualità e un potente modello neurale chiamato umBERTo, raggiungono una precisione dell'84%".

La comunità scientifica (e chiunque abbia qualche conoscenza di programmazione) può ora utilizzare il nuovo set di dati per costruire i propri strumenti, o eseguire il modello versatile pronto all'uso per rilevare il sentiment e le emozioni nei post dei social media su una vasta gamma di argomenti.

Chi non sa (ancora) programmare, non deve scoraggiarsi: i ricercatori stanno lavorando su un servizio web che renderà il loro lavoro ancora più ampiamente accessibile.