Inteligencia artificial está traduciendo las ancestrales tablillas cuneiformes
Investigadores de la Universidad de Tel Aviv (TAU) y la Universidad Ariel han desarrollado un modelo de inteligencia artificial que puede traducir automáticamente texto acadio escrito en cuneiforme al inglés.
En su momento de máxima expansión —en el siglo VII a.C., durante el Imperio neoasirio—, Asiria controlaba un territorio que hoy comprendería, parcial o totalmente, los países de Irak, Siria, Palestina, Israel, Jordania, Líbano, Turquía, Irán, Arabia Saudita, Egipto, Kuwait, Chipre, Armenia, Azerbaiyán y Georgia.
Las excavaciones realizadas en muchos de estos sitios, sobre todo en las grandes capitales, pero también en los centros administrativos provinciales, permitieron el descubrimiento de miles de tablillas de arcilla inscritas en cuneiforme que han permitido conocer muchos aspectos de la vida de los antiguos asirios. Se distribuyen de forma desigual en el espacio y el tiempo, de modo que ciertos períodos, lugares y actividades determinados están bien documentados —como el comercio internacional asirio del siglo XIX—, mientras que de otros nada se sabe, como de las actividades agrícolas alrededor de la ciudad acadia de Aššur en el mismo periodo.
Sin embargo, la gran cantidad de estas tablillas ha superado históricamente el número limitado de expertos que pueden leerlas… Hasta ahora, porque la nueva tecnología que está revolucionando el mundo podría cambiarlo todo.
Un equipo dirigido por el Dr. Shai Gordin de la Universidad Ariel, y el Dr. Gai Gutherz, el Dr. Jonathan Berant y el Dr. Omer Levy de TAU, ha desarrollado un nuevo modelo de aprendizaje automático capaz de traducirlas.
Este modelo de IA fue entrenado en dos versiones: una que traduce el acadio a partir de representaciones de los signos cuneiformes en escritura latina y otra que traduce a partir de representaciones Unicode de los signos cuneiformes. La primera versión, utilizando la transliteración latina, dio resultados más satisfactorios en este estudio, logrando una puntuación de 37,47 en el Best Bilingual Evaluation Understudy 4 (BLEU4), que es una prueba del nivel de correspondencia entre la traducción humana y la máquina de un mismo texto.
Colaboración hombre-máquina
El programa es más efectivo cuando se traducen oraciones de 118 o menos caracteres. En algunas de las oraciones, el programa produjo «alucinaciones», un resultado sintácticamente correcto en inglés pero no exacto.
Gordin señaló que, en la mayoría de los casos, la traducción se podría usar como un primer paso en el texto. Los autores proponen que la traducción automática se puede usar como parte de una «colaboración hombre-máquina», en la que los académicos humanos corrigen y refinan los resultados de los modelos.
«Puede ser un proceso complejo, ya que normalmente requiere no solo un conocimiento experto de dos idiomas diferentes, sino también diferentes entornos culturales. Las herramientas digitales que pueden ayudar con la traducción son cada vez más omnipresentes cada año, vinculadas a los avances en campos como el reconocimiento óptico de caracteres (OCR) y la traducción automática. Las lenguas antiguas, empero, todavía plantean un problema enorme en este sentido. Su lectura y comprensión requieren el conocimiento de una comunidad lingüística muerta hace mucho tiempo y, además, los textos en sí también pueden ser muy fragmentarios», concluyeron los investigadores israelíes.
Un artículo detallando el nuevo avance ha sido publicado en PNAS Nexus.