Unione Europea
La Commissione europea ha compiuto un altro passo nel suo sforzo di promozione del multilinguismo come parte essenziale dell’unità dell’Europa nella diversità. La sua raccolta di circa 1 milione di frasi, associate ad una traduzione di qualità delle stesse in 22 delle 23 lingue ufficiali dell’Ue – incluse quelle dei nuovi Stati membri – è la più grande mai realizzata in un numero così elevato di lingue ed è ora disponibile gratuitamente.
Questo tipo di dati è estremamente ricercato da quanti si dedicano all’elaborazione di sistemi di traduzione automatica in cui il programma di traduzione “impara” a tradurre correttamente e nel loro contesto parole e frasi a partire da testi tradotti da professionisti. I dati possono inoltre contribuire allo sviluppo di altri strumenti linguistici informatizzati come i controllori grammaticali e ortografici, i dizionari on-line e i sistemi di classificazione di testi multilingui.
Leonard Orban, commissario responsabile per il multilinguismo, ha dichiarato: “Con questa iniziativa la Commissione europea intende dare impulso alle tecnologie del linguaggio, sostenere il multilinguismo e rendere la traduzione assistita da computer più semplice, economica e accessibile. I cittadini appartenenti a comunità linguistiche di ridotte dimensioni potranno accedere con maggiore facilità a documenti e pagine web disponibili unicamente nelle lingue più utilizzate.”
Janez Potočnik, commissario europeo per la scienza e la ricerca, ha dichiarato: “Questa eccezionale raccolta di dati linguistici contribuisce alla creazione di una nuova generazione di programmi informatici per il trattamento del linguaggio umano e contribuisce ad incentivare la competitività dell’industria linguistica, che già risulta tra quelle in più rapida crescita nell’Unione europea.”
Le istituzioni della Ue possiedono più testi multilingue di ogni altra istituzione a causa della necessità di rendere disponibile la normativa comunitaria in ciascuna delle 23 lingue ufficiali. I loro servizi di traduzione lavorano con 253 coppie di combinazioni linguistiche possibili e producono all’incirca 1,5 milioni di pagine tradotte all’anno.
Benché su Internet sia possibile reperire numerose traduzioni di testi inglesi o francesi, tale materiale risulta scarso per lingue come il lettone o il rumeno e praticamente inesistente per combinazioni di lingue che dispongono di risorse limitate.
La Commissione, grazie a una stretta collaborazione fra i suoi traduttori e i suoi esperti scientifici interni, sta dunque rendendo pubbliche vaste raccolte di frasi provenienti da testi giuridici che coprono ambiti tecnici, politici e sociali e sono disponibili in 22 lingue. In questo fondo di traduzione è possibile reperire frasi con il loro equivalente in tutte le lingue ufficiali. Solo le traduzioni in gaelico restano per il momento ancora indisponibili. La pubblicazione di questi dati linguistici costituisce un buon esempio della politica trasparente della Commissione in materia di riutilizzo delle proprie informazioni e fa seguito all’apertura al pubblico delle basi di dati documentarie e terminologiche dell’Ue, Eur-Lex e IATE.
La Commissione possiede una vasta esperienza nello sviluppo di strumenti di trattamento di testi multilingue e figura all’avanguardia del multilinguismo, offrendo siti web di ricerca di notizie accessibili al pubblico che arrivano a coprire fino a 35 lingue tramite lo strumento European Media Monitoring. Il capitolo “Tecnologie dell’informazione e della comunicazione” del Settimo programma quadro di ricerca e sviluppo sostiene la ricerca nel campo della traduzione automatica e di altre tecnologie legate al linguaggio.