Un traductor que imita la red neuronal

creado a partir de inteligencia artificial traduce textos de castellano a euskera y viceversa de hasta 4.000 caracteres

10.02.2020 | 07:59
La versión beta del traductor, la definitiva se colgará en unos meses.

el Gobierno Vasco ha desarrollado un "traductor automático neuronal" que ya está disponible para todos los ciudadanos a través de internet y que puede traducir textos de euskera a castellano, y viceversa, de hasta 4.000 caracteres por cada uso, con una gran calidad. La versión definitiva se colgará en unos meses en la misma página donde puede ya utilizarse una versión beta para que la ciudadanía "la pruebe y el traductor se entrene": www.euskadi.eus/itzultzailea. Antes de final de año, además, estarán listas las app para teléfonos móviles y tabletas, y también será posible realizar traducciones en los teléfonos a través de la voz.

Los consejeros de Gobernanza Pública y Autogobierno, Josu Erkoreka, y de Cultura y Política Lingüística, Bingen Zupiria, presentaron ayer en San Sebastián esta herramienta como "el primer proyecto práctico del Gobierno Vasco para el uso ciudadano creado imitando las redes del cerebro a partir de la inteligencia artificial". Su objetivo, destacó Zupiria, "no es, en ningún caso, sustituir el trabajo de los traductores", sino "ofrecer un instrumento innovador y eficaz a quienes utilizan las dos lenguas en el mundo laboral y académico", entre otros. No es un traductor "autosuficiente", añadió, y necesita "vigilancia" porque "puede cometer errores", aunque ha destacado que el resultado de las traducciones es de gran calidad.

El consejero explicó que, por su experiencia, la traducción de las notas de prensa es "muy homologable" y la de los textos administrativos "francamente buena", pero la de una poesía surrealista es igualmente "surrealista e incomprensible".

"Las traducciones basadas en la gramática y el análisis, aunque sean correctas, tienen un cariz artificial, y son un tanto ortopédicos. Sin embargo, las obtenidas a través de las redes neuronales son fáciles de leer porque tienen coherencia y mantiene mejor la conexión entre los elementos dentro de la frase", explicó Zupiria.

Por su parte, Erkoreka explicó que esta nueva herramienta es fruto del trabajo de varios años y ha sido implementado utilizando memorias de traducción recopiladas por el Instituto Vasco de Administración Pública (IVAP). Este organismo lleva veinte años creando memorias de traducción, lo que permite que actualmente se disponga de bases de datos con más de diez millones de segmentos traducidas, revisadas y actualizadas. "Años de trabajo nos permiten disponer de una base terminológica y lingüística solo comparable a la de las lenguas más habladas del mundo. Tenemos un corpus de traducción sistemática de valor incalculable", aseguró el consejero Erkoreka.

euskera, la lengua con más significados en wikidata Por otra parte, la organización Euskal Wikilarien Kultur Elkartea y Elhuyar anunciaron ayer que el euskera es la lengua que tiene un mayor número de significados en la base de datos Wikidata, por delante del inglés, el castellano y el francés, entre otras. De entre todas las lenguas incluidas en Wikidata, el euskera se encuentra en el sexto lugar en cuanto al número de lexemas, ocupa el segundo puesto en cuanto al número de formas de las palabras y es el principal idioma en cuanto al número de significados.

Wikidata, según recordaron estas organizaciones es una gran base de datos que se edita de forma colaborativa. Lo gestiona la Fundación Wikimedia con el fin de utilizarlo en sus proyectos, por ejemplo, en Wikipedia.