Il nuovo traduttore universale automatico

RICORDATE «Mars Attacks» di Tim Burton, geniale parodia del cinema di fantascienza vecchio stile? Nel film, per dialogare con i marziani appena sbarcati sulla Terra, l’esercito americano usa una sorta di «traduttore universale automatico», che però fraintende completamente il messaggio di saluto dei visitatori, causando una guerra interplanetaria. In effetti, affidarsi a un sistema di traduzione automatica in una situazione del genere sarebbe piuttosto pericoloso. La maggior parte di questi software, come ben sa chi li utilizza regolarmente (molti sono disponibili anche sul Web, per esempio su Google o Altavista), se la cavano benissimo con parole isolate o frasi semplici, ma danno origine a traduzioni improbabili e spesso esilaranti appena devono vedersela con frasi più complesse. Eppure, dopo una storia travagliata e diversi momenti in cui l’impresa stava per essere abbandonata, il settore della traduzione automatica sta vivendo oggi una seconda giovinezza. Lo dimostra per esempio TransTac (Translation Systems for Tactical Use), un progetto finanziato dal Darpa (l’agenzia di ricerca del dipartimento della Difesa Usa), che dovrebbe consentire alle truppe americane nei Paesi arabi di comunicare con la popolazione. L’idea è dotare i soldati di un computer palmare con software di riconoscimento e sintesi vocale: se parlano in inglese, una voce computerizzata traduce simultaneamente in arabo, per poi fare lo stesso, dall’arabo all’inglese, con le parole dell’interlocutore. TransTac è uno dei tentativi in corso per superare i limiti storici dei sistemi di traduzione automatica basati su regole grammaticali fisse, che hanno collezionato solo fallimenti. Sono stati questi problemi a stroncare quasi sul nascere i primi tentativi di trasformare i computer in traduttori simultanei, nati subito dopo la Seconda Guerra Mondiale. Nel 1954 i ricercatori della Georgetown University di Washington crearono un sistema che, sulla base di sei regole grammaticali e un vocabolario di 250 parole, era in grado di tradurre 60 frasi dal russo all’inglese. Quel progetto attirò grandi finanziamenti sulla linguistica computazionale (il settore che si occupa del trattamento informatico delle lingue naturali) e i suoi creatori annunciarono che nel giro di cinque anni il problema della traduzione automatica sarebbe stato risolto. Ma nel 1966 il rapporto Alpac, commissionato dal governo Usa, concludeva che 12 anni di ricerca in questo campo avevano prodotto solo delusioni e che la Casa Bianca avrebbe fatto meglio a spendere i suoi soldi diversamente. Dall’altra parte dell’Atlantico il progetto EuroTra vide collaborare, negli Anni ‘70, molti istituti di ricerca europei alla creazione di un software per la traduzione automatica: si risolse in un insuccesso, ma permise la nascita di molti gruppi di ricerca tuttora attivi nella linguistica computazionale.
Il problema principale è che qualunque lingua è fatta, in realtà, di eccezioni più che di regole e che non c’è modo di prevederle tutte e trasformarle in un set finito di istruzioni per un calcolatore. A partire dagli Anni ‘80, però, grazie anche alla maggiore potenza di calcolo dei computer, la ricerca è ripresa, puntando su un approccio molto diverso. Sistemi come TransTac sfruttano, infatti, metodi statistici: questi software vengono «allenati» con enormi repertori di testi nelle singole lingue ed estraggono da soli le regole. «Imparano», per esempio, che una parola compare frequentemente associata ad alcune altre o che in una lingua si tende a invertire soggetto e complemento più spesso che in un’altra: in questo modo possono, di fronte a nuove frasi, calcolare la traduzione più probabile, anziché affidar
si a regole troppo rigide. Un sistema sviluppato all’Università di Karlsuhe, in Germania, chiamato «Lecture Translator» e progettato per tradurre discorsi ufficiali, è stato istruito usando le registrazioni delle sedute del Parlamento Europeo, ideali perché lì si parla di una vasta gamma di argomenti. Certamente - spiegano gli esperti - nessuno di questi sistemi può al momento sostituire gli interpreti umani in situazioni delicate. Ma è probabile che diventino presto di uso comune nelle situazioni dove è richiesta grande rapidità.

Nicola Nosengo
la stampa web

…ma siamo arrivati al traduttore universale di Star Trek? :smiley: