Contatti

La traduzione automatica in inglese ti fa sembrare un maschio di mezza eta'

, di Fabio Todesco
Tre studiosi della Bocconi hanno individuato una distorsione algoritmica nella traduzione da diverse lingue europee all'inglese dei sistemi di Google, Bing e DeepL

Immaginate una bambina cresciuta in una cittadina abitata solo da uomini di mezza età. Per i primi dieci anni della sua vita, sente solo uomini sulla sessantina parlare di lavoro, libri, sport, salute e denaro. Che tipo di strana lingua pensate che parlerà quando lascerà la cittadina?

Qualcosa di simile accade ai più comuni sistemi di traduzione automatica, secondo un nuovo studio di Dirk Hovy, professore associato di Computer Science alla Bocconi, e di due ricercatori post-doc del suo laboratorio, Federico Bianchi e Tommaso Fornaciari. Per addestrare un sistema di traduzione basato sul machine learning, lo si alimenta con grandi quantità di testi e lo si lascia imparare per esperienza. Se gli si forniscono documenti scritti per lo più da maschi di mezza età, anche le traduzioni suoneranno come se fossero state scritte da uomini di quella fascia d'età.

Lo studio analizza le traduzioni in inglese da quattro lingue europee (tedesco, francese, italiano e olandese) prodotte da tre sistemi commerciali (Google Translate, DeepL e Bing). Il team di ricerca ha fornito sia i testi originali sia le loro traduzioni ad altri sistemi di machine learning, chiamati classificatori, addestrati a prevedere l'età e il sesso di chi scrive un testo.

Partendo da un set di dati ripartiti in modo uniforme tra autori di sesso femminile e maschile, i classificatori hanno erroneamente previsto la distribuzione di genere delle traduzioni in inglese. Nelle traduzioni dal tedesco, hanno stimato la percentuale di testi scritti da uomini al 63-64% (a seconda del sistema commerciale utilizzato), al 57-64% per le traduzioni dall'italiano e al 52-55% dall'olandese. I testi francesi sono tradotti in modo piuttosto fedele in termini di genere e solo il 51% sembra scritto da maschi.

Nella direzione opposta, traducendo dall'inglese verso altre lingue, gli autori trovano evidenze contrastanti: le traduzioni in francese e in tedesco suonano più femminili, quelle in italiano e in olandese più maschili.

Infine, gli autori hanno ripetuto l'esercizio per prevedere le fasce d'età. In questo caso, i sistemi di traduzione automatica hanno prodotto traduzioni in inglese che suonano in modo sproporzionato come se fossero scritte da sessantenni.

Ciò che Hovy e i suoi colleghi hanno individuato è una distorsione algoritmica precedentemente sconosciuta. "Questi sistemi sono comunemente usati per tradurre una vasta gamma di documenti", dice Hovy, "e possono finire per normalizzare e rafforzare alcuni stereotipi. Tornando alla bambina cresciuta in una cittadina di soli uomini di mezza età: non è solo che lei suonerebbe strana al resto del mondo, ma anche che il resto del mondo - donne, giovani e così via - le suonerebbe in qualche modo sbagliato".

"Fino a poco tempo fa, per la traduzione automatica lo stile del testo non era una preoccupazione. I ricercatori si preoccupavano di produrre una buona traduzione in termini di contenuto", conclude Hovy. "C'era una mancanza di consapevolezza della distorsione e delle sue conseguenze. Tuttavia, la mia impressione è che ora stiano cercando di affrontare il problema".

Dirk Hovy, Federico Bianchi, Tommaso Fornaciari, "'You Sound Just Like Your Father'. Commercial Machine Translation Systems Include Stylistic Biases", in Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. 2020.