Quanto dovrebbe costare Ibrahimovic? Te lo dice il Machine Learning
Quanto dovrebbe costare Ibrahimović? Te lo dice il Machine Learning
Daniele Durante, premiato per l'innovazione della didattica, ha progettato una piattaforma che consente agli studenti di mettere in pratica le nozioni tecniche apprese in aula sfidandosi alla miglior previsione in molti campi applicativi. Compresi gli ingaggi dei calciatori.
Hai mai visto il film Moneyball? Racconta la vera storia del general manager di una squadra americana di baseball che, per far fronte ai pochi fondi a disposizione, si affida agli studi statistici di un laureato di Yale per individuare giocatori sottovalutati dal mercato rispetto alle loro reali potenzialità. Il risultato? Una squadra vincente, a basso costo, ottenuta a suon di algoritmi predittivi. Sapresti far meglio del giovane di Yale, non solo nello sport, ma anche in altre applicazioni, come la classificazione di e-mails spam e non spam, o la previsione del traffico telefonico?
Per conoscere la risposta, però, devi poter accedere alla piattaforma, denominata Data Science Challenges, che Daniele Durante, Assistant Professor del Dipartimento di Scienze delle Decisioni dell'Università Bocconi, uno dei docenti premiati dall'Università per l'innovazione della didattica, ha progettato con il supporto del BUILT e messo a disposizione degli studenti del corso di Machine Learning nell'ambito del corso di laurea specialistica in Data Science and Business Analytics. "Uno degli obiettivi principali del Machine Learning è prevedere con accuratezza una specifica variabile d'output in funzione di una serie di variabili in input", spiega Durante, "per far questo, vengono allenati degli algoritmi di previsione su un dataset con in cui sia l'output che gli inputs sono osservati, e poi l'accuratezza di tali algoritmi viene valutata misurando, su un nuovo insieme di dati, quanto i valori previsti per l'output si avvicinano a quelli effettivamente osservati".
L'obiettivo che Durante si è posto è stato quello di sviluppare una piattaforma che riproducesse questo processo d'analisi in una serie di stimolanti applicazioni di Machine Learning sulle quali i ragazzi fossero in grado di applicare i metodi studiati in classe e, nello stesso tempo, esercitarsi sfidandosi alla miglior previsione. "Ogni nuova sfida che apro nella piattaforma contiene due dataset. Uno in cui gli studenti hanno a disposizione sia l'output che gli inputs, e un'altro in cui solo i valori degli inputs sono noti", spiega Durante,
"Nel caso del calcio, per esempio, gli inputs sono moltissime variabili sulle prestazioni sportive dei giocatori, mentre l'output è il prezzo del loro ingaggio. Utilizzando il primo dataset, gli studenti identificano ed allenano un algoritmo di Machine Learning che poi applicano al secondo set di dati per ottenere una previsione sugli ingaggi dei calciatori per i quali tale informazione è a loro ignota. Queste previsioni vengono caricate nella piattaforma che fornisce loro una misura di quanto gli ingaggi previsti si avvicinano a quello effettivi (noti alla piattaforma, ma non agli studenti)". Il tutto sotto forma di sfida, con una classifica che si aggiorna in tempo reale e ordina gli studenti dal primo all'ultimo sulla base dell'accuratezza delle ultime previsioni caricate. "Questo stimola molto gli studenti ad esercitarsi, a migliorarsi, a condividere idee e, soprattutto, li aiuta ad autovalutarsi in base alla posizione occupata in classifica".
Per Renato Berlinghieri, studente del secondo anno del corso di laurea in Data Science e Business Analytics, "si tratta di una piattaforma molto funzionale, in cui gli aspetti teorici e metodologici del Machine Learning vedono la loro naturale componente di applicabilità. Qui possiamo applicare in modo pratico gli insegnamenti teorici e vedere i nostri progressi". Per Renato, un futuro ancora in bilico tra le aziende del settore tecnologico e la carriera accademica, "esistono anche online piattaforme con caratteristiche simili, ma questa è particolarmente ben fatta e in più aggiunge il gusto della sfida. Se sei in cima alla classifica ti impegni al massimo per restarci, se sei in fondo fai di tutto per recuperare, con il risultato, in entrambi i casi, di esercitarti sempre di più".