Contatti

Machine learning per prevedere se lascerai il tuo partner

, di Fabio Todesco
Una ricerca sulla dissoluzione delle coppie mostra che un approccio di ML puo' far progredire la ricerca demografica, rilevando schemi complessi in dataset relativamente piccoli

La soddisfazione di vita dell'uomo e della donna e la percentuale di lavoro domestico a carico della donna si sono rivelati i più importanti predittori della dissoluzione di una coppia, quando tre studiosi affiliati al Dondena Centre for Research on Social Dynamics and Public Policy della Bocconi hanno utilizzato una tecnica di machine learning (ML) per analizzare i dati su 2.038 coppie sposate o conviventi che hanno partecipato al German Socio-Economic Panel Survey.

Le coppie sono state seguite, in media, per 12 anni, per un totale di 18.613 osservazioni. Durante il periodo, 914 coppie (45%) si sono separate.

Infografica di Weiwei Chen
Nel loro articolo, appena pubblicato online su Demography, Bruno Arpino (Università di Firenze), Marco Le Moglie (Università Cattolica di Milano) e Letizia Mencarini (Bocconi), hanno usato una tecnica di ML chiamata Random Survival Forests (RSF) per superare la difficoltà di gestire un gran numero di variabili indipendenti nei modelli convenzionali.

"Un chiaro esempio delle potenziali difficoltà di considerare tutte le variabili e le loro possibili interazioni riguarda i tratti di personalità, i cosiddetti big five", dice Mencarini. "Per tenere conto dei tratti di entrambi i partner (10 variabili) e di tutte le loro possibili interazioni (25 variabili), si dovrebbero considerare 35 variabili indipendenti, il che sarebbe molto problematico in un modello di regressione". Gli strumenti di ML sono, al contrario, capaci di rilevare schemi complessi in dataset relativamente piccoli.

Un altro vantaggio del ML dovrebbe essere un potere predittivo superiore rispetto ai modelli convenzionali, più adatti a spiegare come funzionano certi meccanismi che a prevedere il comportamento futuro delle variabili. Quando gli autori hanno diviso il loro campione in due parti e hanno usato i risultati della prima metà per predire quelli della seconda metà, hanno trovato che l'accuratezza predittiva di RSF era notevolmente superiore a quella dei modelli convenzionali. Era, tuttavia, un'accuratezza ancora limitata, nonostante l'uso, come variabili di input, di tutti i più importanti predittori della dissoluzione di coppia identificati in letteratura.



Tra le variabili con la maggiore capacità predittiva, gli autori hanno individuato la soddisfazione di vita di entrambi i partner, la percentuale di lavoro domestico a carico della donna, lo stato civile (cioè, sposati o conviventi), gli orari di lavoro della donna, il livello di apertura della donna e il livello di estroversione dell'uomo.

L'analisi ha anche evidenziato che molte variabili interagiscono in modo complesso. Per esempio, quando la soddisfazione di vita dell'uomo è alta, le possibilità di sopravvivenza della coppia aumentano continuamente all'aumentare della soddisfazione di vita della donna. Ma quando la soddisfazione della vita dell'uomo è bassa, l'associazione tra la soddisfazione della vita della donna e la sopravvivenza della coppia diventa negativa dopo una data soglia.

Gli autori non hanno rilevato alcun effetto di interazione tra i tratti personali: l'apertura della donna e l'estroversione dell'uomo rendono più probabile la dissoluzione della coppia, indipendentemente dalla personalità del partner.

Bruno Arpino, Marco Le Moglie, and Letizia Mencarini, "What Tears Couples Apart: A Machine Learning Analysis of Union Dissolution in Germany," Demography, advance publication, DOI: https://doi.org/10.1215/00703370-9648346.