Contatti

Docenti e studenti, una collaborazione statisticamente perfetta

, di Marco Bonetti e Pietro Tebaldi
Stata Journal ha pubblicato il lavoro di uno studente del biennio di Economics and Social Sciences, Pietro Tebaldi, portato a termine con Marco Bonetti (Bocconi) e Marcello Pagano (Harvard)

L'articolo M Statistic Commands:Interpoint Distance Distribution Analysis (Stata Journal, vol. 11, n. 2, 2011), risultato del lavoro dello studente di M.Sc. Pietro Tebaldi, descrive un pacchetto software attraverso il quale gli utenti del programma statistico Stata possono ora implementare agevolmente il metodo della "M statistic" di Bonetti e Pagano. L'articolo ed il software sono il risultato della collaborazione tra Pietro Tebaldi, Marco Bonetti (Dipartimento di Analisi delle Politiche e Management Pubblico), e Marcello Pagano (Dipartimento di Biostatistics, Harvard University).

Tebaldi ha infatti sviluppato il software ed il paper durante la sua internship presso la Harvard University nel 2010, durante il suo percorso come studente di M.Sc. in Economic and Social Sciences presso l'Università Bocconi.

Il metodoM statistic fu introdotto da Bonetti e Pagano nel 2005, ed è stato l'oggetto di una serie di articoli, sia di natura teorica che applicata. La statistica M può essere utilizzata per rispondere ad una delle domande chiave nello studio di dati spaziali: la ricerca di evidenza empirica a sostegno dell'ipotesi che due gruppi nella popolazione abbiano una diversa distribuzione nello spazio. La statistica M può essere utilizzata in tutti gli studi in cui la dimensione spaziale delle variabili sia rilevante. La tecnica consiste in un test statistico basato su una quantità costruita utilizzando tutte le distanze (dissimilarità) tra le osservazioni nei dati, combinate per studiarne la distribuzione. L'utilizzo di tutte le distanze tra le osservazioni è ciò che caratterizza il metodo rispetto ad altre tecniche utilizzate per lo stesso problema che utilizzano un numero inferiore di distanze (alcune tra le più vicine, ovvero una regione attorno a ciascuna unità), ovvero altre misure di sintesi della distribuzione delle distanze stesse.

Pensato inizialmente per essere utilizzato per la rilevazione di cluster spaziali in epidemiologia e biosorveglianza, il metodo è anche utilizzabile in contesti caratterizzati da dati ad alta dimensionalità per i quali sia possibile definire una misura di dissimilarità tra le osservazioni. Esempi di altri campi di applicazione sono l'economia (network analysis e impact evaluation), la sociologia (subpopulation studies), la genetica (cluster detection in sequenze DNA), e la demografia (studio di life courses).

Per agevolare l'utilizzo del metodo era necessario renderlo facilmente fruibile all'interno di un pacchetto statistico standard, e questo è stato trasformato in un'opportunità di internship come 'summer visiting student' per l'allora studente del M.Sc. in Economic and Social Sciences Pietro Tebaldi.

Dopo avere lavorato su un progetto di programmazione su Stata sotto la supervisione di Bonetti a Milano, Tebaldi ha trascorso tre mesi del 2010 presso il Dipartimento di Biostatistica della Harvard University (School of Public Health). Qui ha lavorato come research assistant alla pari degli studenti di Ph.D. in Biostatistics del dipartimento, avendo a disposizione un ufficio ed accesso alle innumerevoli risorse dell'ateneo ospitante. Il suo lavoro di programmazione, diretto da Pagano, ha portato all'attuale pacchetto statistico, che offre all'utilizzatore di Stata la possibilità di eseguire il test M e di produrre l'output grafico associato.

Nell'articolo M Statistic Commands:Interpoint Distance Distribution Analysis la descrizione dei comandi ed il loro utilizzo è accompagnata da un'estesa applicazione a dati sui tumori al seno nello stato del Massachusetts. Il comando mtest è utilizzato in questo contesto per studiare la presenza di zone con un'incidenza della malattia più alta della media.

Dopo la laurea specialistica Bocconi, Pietro Tebaldi sta ora proseguendo i suoi studi nell'ambito del programma di Ph.D. in Economics presso la Stanford University.