Calcolare il rischio di conflitto
È chiaramente molto importante avere una stima del rischio di conflitto. Infatti, soprattutto in Africa, Asia e Medio Oriente, il rischio Paese valutato anche dagli investitori è influenzato dal rischio di conflitto. Molti conflitti civili, soprattutto in Africa, possono essere considerati come conflitti etnici - tipicamente coinvolgono il governo contro un gruppo etnico. Pertanto, la stima del rischio di conflitto richiede una stima della forza militare dei gruppi etnici. Ciò è dovuto al fatto che, come stabilito da Herrera et al (2022) e Morelli et al (2023), la differenza tra la forza militare e il potere politico di un gruppo etnico (rispetto al governo corrispondente) è un fattore cruciale di innesco del conflitto civile. Tuttavia, trovare misure del potere militare a livello di gruppo etnico è estremamente difficile.
Definendo la potenza militare relativa di un gruppo etnico come la probabilità di vincere un conflitto contro il governo corrispondente, l'apprendimento automatico può essere utilizzato per ottenere tale stima anche per i gruppi che non hanno mai vissuto un conflitto. In Morelli et al. (2023) utilizziamo un campione esteso di conflitti in Asia e Africa combinato con un ricco insieme di variabili a livello di gruppo etnico e di Paese per dedurre la probabilità di vittoria di tutti i potenziali conflitti tra ogni gruppo etnico (ribelle) e il governo corrispondente. L'algoritmo di apprendimento avanzato che adottiamo ha l'obiettivo di selezionare le variabili predittive rilevanti, oltre a un importante obiettivo di convalida incrociata. Utilizziamo uno stacked ensemble learner, un metodo che combina più algoritmi di apprendimento. Lo stacking, o superapprendimento, è una procedura che mira a trovare la combinazione ottimale di algoritmi di previsione. In generale, l'errore di cross-validated del learner è semplicemente l'errore medio commesso su ciascuna delle N previsioni.
I vari algoritmi di apprendimento che utilizziamo, la random forest, il gradient boosting machine e i modelli lineari generalizzati, hanno tutti pro e contro, e la procedura di stacking ne migliora le prestazioni. Per dare un'idea, i lavori precedenti sulle approssimazioni della probabilità di vittoria di un gruppo etnico utilizzavano le dimensioni relative della popolazione o le nightlight proxy della forza economica. Rispetto a queste approssimazioni precedenti, stimiamo che l'algoritmo di apprendimento automatico migliori la precisione di quasi il 20%. Un 20 per cento in più di precisione è molto importante in quasi tutti i campi.
Più in generale, nelle scienze sociali siamo spesso interessati a stimare la probabilità di successo di un'azione di un agente in funzione delle sue caratteristiche, e nelle osservazioni disponibili solo una frazione degli agenti studiati compie tali azioni. L'apprendimento automatico permette di stimare la probabilità di successo anche per gli agenti che non compiono mai un'azione, sulla base di tutti i dati disponibili sull'insieme delle caratteristiche di tutti gli agenti.