Tecnología europea para conservar la diversidad lingüística

Conversación a través de Skype usando el intérprete automático.

Conversación a través de Skype usando el intérprete automático.

CARMEN JANÉ / BARCELONA

Por qué confiar en El PeriódicoPor qué confiar en El Periódico Por qué confiar en El Periódico

Si Europa quiere mantener su multiculturalidad y convertirse en el segundo mercado económico mundial para el 2020, por detrás de EEUU más el Reino Unido, y por delante de China, tendrá que conseguir que sus clientes y vendedores, con 24 lenguas oficiales, puedan entenderse entre ellos para hacer negocios. Porque ahora, señalan las estadísticas, los europeos casi nunca compran en internet si no lo pueden hacer en su lengua habitual y la falta de traducción hace difícil de resolver su Babel digital. Por ello, más de 3.600 investigadores europeos han suscrito un manifiesto en el que reclaman más inversión para lo que puede ser la panacea: la traducción automática.

Las tecnologías de la lengua, que comprenden el procesamiento del lenguaje natural, el aprendizaje automático, el reconocimiento del habla y los asistentes virtuales, se perfilan como alternativas no a los traductores humanos sino al uso del inglés como lengua franca en el ansiado Mercado Digital Único, para el que se están unificando normativas en los 27 estados miembros. Los investigadores, entre ellos varios catalanes, reclaman que se utilice su materia para preservar la riqueza multilingüística y multicultural de Europa, además de permitir cuestiones como la patente única europea, el expediente de salud transnacional o el papeleo administrativo.

«Hace un par de años que la Comisión Europea no considera estratégica la investigación en tecnologías de la lengua. Parece que hay la sensación de que se ha tocado techo y que Google Translator ya está bien. Se pueden hacer cosas muy buenas con tiempo y recursos», afirma Lluís Padró, director del Centro de Tecnología y Aplicaciones del Lenguage (TALP), de la Universitat Politècnica de Catalunya, y firmante del texto.

Precisamente, el big data(uso masivo de datos) ha sido la tecnología que está permitiendo los grandes avances en materia lingüística, porque las traducciones automáticas funcionan a partir de comparar millones de textos originales y sus traducciones, y automatizar el proceso por el que se elige una solución u otra según varios criterios.

«Hace falta dinero para completar lo que llamamos un kit de recursos básicos para cada lengua y que son como la gasolina que necesitamos para funcionar. Para las empresas estos recursos son un tesoro. Y solo los que generamos las universidades son públicos. Para las empresas, son su tesoro», señala Núria Bel, profesora de la Universitat Pompeu Fabra y también firmante. «A los traductores no les va a faltar trabajo pero la cantidad de información que hay que traducir es inabarcable. Una web igual usa traductores humanos para sus clientes principales, pero para lenguas minoritarias, pues recurre a la automática».

Los investigadores europeos, además, son muy apreciados y tentados. Alemán es, por ejemplo, Franz Josef Och, jefe de la unidad de traducción automática de Google durante 10 años y padre de Google Translator, que ahora dedica su conocimiento a la biomedicina. Y muchos investigadores, algunos catalanes, han fichado por multinacionales.

MANOS NO EUROPEAS / «La traducción automática on line así como otros servicios tecnológicos lingüísticos están dominados por compañías globales que no son europeas y que se centran sobre todo en el inglés y en otras pocas de las lenguas más habladas del mundo descuidando las lenguas europeas con menor poder económico. Como resultado, casi la mitad de los ciudadanos europeos están en desventaja digital debido a su lengua materna», denuncia el manifiesto Multilingual Europe.

Y es que Google, Facebook, Microsoft, eBay y Apple han sido algunos de los grandes inversores en tecnologías de la lengua con fines publicitarios o comerciales. También eBay o Tripadvisor llevan años aplicando traducciones automáticas a sus productos o reseñas. Y el Gobierno estadounidense ha destinado millones a proyectos lingüísticos relacionados con el árabe, el farsi (lengua dominante en Irán) o el ruso.

Pero estas empresas se centran, como todas, en sus propios intereses y nadie se ha dedicado a crear, por ejemplo, un sistema automático español-chino. Google Translator, si no encuentra suficiente volumen de textos de una lengua A, traduce el texto al inglés y de ahí lo pasa al idioma B, para poder ofrecer una traducción de A a B. «La calidad de la traducción, por supuesto, se resiente», recuerda Bel. Pero no solo eso, el propio buscador lo desprecia y lo relega en sus resultados. Hasta las máquinas quieren calidad.

El catalán, con tantos recursos como el alemán y por encima del portugués

Pese a no ser lengua oficial en Europa, el catalán, octava lengua en hablantes de la UE (con 10 millones de usuarios en varios países), no está mal posicionado para la traducción automática y el análisis de los textos, ya que cuenta con tantos recursos como los que tiene el alemán (la primera) o el italiano (la cuarta) y está por encima del portugués o el sueco.

La razón hay que buscarla, además de en la inversión pública, en el activismo de sus hablantes, que han poblado internet de páginas (solo con dominio .cat había 83.300 webs el año pasado) y artículos de la Wikipedia, e investigadores. «Cuando preparábamos recursos para el castellano, lo hacíamos también para catalán, gallego y euskera», señala la profesora Bel. Grupos de voluntarios como Softcatalà llevan años traduciendo programas libres sin más compensación que el favor de los usuarios.

Sin embargo, los investigadores catalanes sueñan con que su base de datos relacional sea tan extensa y completa como la que tiene el inglés con Wordnet, que mantiene la Universidad de Princeton y que comenzó a entrar registros en 1985, y que es la envidia del sector.