Contatti
Opinioni

Calcolare il rischio di conflitto

, di Massimo Morelli - professore di Political Science
Grazie all'adozione di un sistema di super apprendimento, che combina piu' algoritmi, i ricercatori Bocconi hanno migliorato del 20% la misura del rischio di conflitto tra gruppi etnici in Africa e Medio Oriente. Un risultato particolarmente rilevante anche per le scelte degli investitori che sono sempre influenzate dal grado di conflittualita' interna a un paese

È chiaramente molto importante avere una stima del rischio di conflitto. Infatti, soprattutto in Africa, Asia e Medio Oriente, il rischio Paese valutato anche dagli investitori è influenzato dal rischio di conflitto. Molti conflitti civili, soprattutto in Africa, possono essere considerati come conflitti etnici - tipicamente coinvolgono il governo contro un gruppo etnico. Pertanto, la stima del rischio di conflitto richiede una stima della forza militare dei gruppi etnici. Ciò è dovuto al fatto che, come stabilito da Herrera et al (2022) e Morelli et al (2023), la differenza tra la forza militare e il potere politico di un gruppo etnico (rispetto al governo corrispondente) è un fattore cruciale di innesco del conflitto civile. Tuttavia, trovare misure del potere militare a livello di gruppo etnico è estremamente difficile.

Definendo la potenza militare relativa di un gruppo etnico come la probabilità di vincere un conflitto contro il governo corrispondente, l'apprendimento automatico può essere utilizzato per ottenere tale stima anche per i gruppi che non hanno mai vissuto un conflitto. In Morelli et al. (2023) utilizziamo un campione esteso di conflitti in Asia e Africa combinato con un ricco insieme di variabili a livello di gruppo etnico e di Paese per dedurre la probabilità di vittoria di tutti i potenziali conflitti tra ogni gruppo etnico (ribelle) e il governo corrispondente. L'algoritmo di apprendimento avanzato che adottiamo ha l'obiettivo di selezionare le variabili predittive rilevanti, oltre a un importante obiettivo di convalida incrociata. Utilizziamo uno stacked ensemble learner, un metodo che combina più algoritmi di apprendimento. Lo stacking, o superapprendimento, è una procedura che mira a trovare la combinazione ottimale di algoritmi di previsione. In generale, l'errore di cross-validated del learner è semplicemente l'errore medio commesso su ciascuna delle N previsioni.

I vari algoritmi di apprendimento che utilizziamo, la random forest, il gradient boosting machine e i modelli lineari generalizzati, hanno tutti pro e contro, e la procedura di stacking ne migliora le prestazioni. Per dare un'idea, i lavori precedenti sulle approssimazioni della probabilità di vittoria di un gruppo etnico utilizzavano le dimensioni relative della popolazione o le nightlight proxy della forza economica. Rispetto a queste approssimazioni precedenti, stimiamo che l'algoritmo di apprendimento automatico migliori la precisione di quasi il 20%. Un 20 per cento in più di precisione è molto importante in quasi tutti i campi.
Più in generale, nelle scienze sociali siamo spesso interessati a stimare la probabilità di successo di un'azione di un agente in funzione delle sue caratteristiche, e nelle osservazioni disponibili solo una frazione degli agenti studiati compie tali azioni. L'apprendimento automatico permette di stimare la probabilità di successo anche per gli agenti che non compiono mai un'azione, sulla base di tutti i dati disponibili sull'insieme delle caratteristiche di tutti gli agenti.