Nuevo servicio de inteligencia artificial en la Universidad de Vilna para descifrar archivos manuscritos en yiddish y hebreo.

Vilnish busca ayudar a académicos y particulares a convertir manuscritos históricos en texto digital con capacidad de búsqueda para fines de investigación, genealogía y documentación legal.

A handwritten letter in Yiddish from Ber Borochov, a pioneer in the study of the Yiddish language, in Vienna, to Leon Khazanovich in Berlin, regarding the health of his family and the possibility of Khazanovich obtaining the vacant post of Berlin correspondent for the New York Yiddish newspaper Di Varhayt, 1913. Credit: YIVO via Creative Commons.
Una carta manuscrita en yidis de Ber Borojov, pionero en el estudio del idioma yidis, desde Viena a Leon Khazanovich en Berlín, sobre la salud de su familia y la posibilidad de que Khazanovich obtenga el puesto vacante de corresponsal en Berlín para el periódico yidis neoyorquino Di Varhayt, 1913. Crédito: YIVO vía Creative Commons.

Se espera que una nueva herramienta digital desarrollada en la Universidad de Vilna, en Lituania, ayude a investigadores, archivos y particulares a descifrar manuscritos y documentos impresos históricos escritos en yiddish y hebreo.

El servicio, conocido como VILNISH , utiliza inteligencia artificial para reconocer textos históricos manuscritos e impresos y convertirlos a formato digital consultable. Se basa en el modelo lingüístico Vilne-Yiddish desarrollado por el investigador Sergii Gurbych, cuyo trabajo se centra en la aplicación del aprendizaje automático a fuentes de archivos judíos.

Esta tecnología está diseñada para procesar manuscritos que durante mucho tiempo han representado un desafío para los historiadores, como diarios manuscritos, cartas, registros de sinagogas y otros documentos comunitarios. Al transformar las páginas escaneadas en texto legible por máquina, la herramienta permite a los usuarios buscar, indexar y analizar materiales que antes requerían una transcripción manual que consumía mucho tiempo.

VILNISH reconoce tanto textos manuscritos como impresos históricos, conservando su ortografía y características originales. Además del reconocimiento de texto, el servicio adapta y traduce el material al inglés o al lituano, facilitando así el acceso a las fuentes a investigadores que no leen yiddish ni hebreo.

La plataforma está diseñada para un amplio abanico de usuarios. Archivos, bibliotecas y museos pueden utilizarla para digitalizar y catalogar grandes colecciones de manuscritos históricos, lo que permite realizar búsquedas de texto completo en sus fondos. Los investigadores que trabajan en historia judía y humanidades digitales pueden aplicar la herramienta para analizar grandes corpus de documentos de forma más eficiente.

Este servicio también puede ser útil para particulares que investigan su historia familiar, permitiéndoles descifrar cartas o documentos escritos hace generaciones en yiddish o hebreo. En algunos casos, dichos documentos pueden servir como prueba en asuntos legales, como solicitudes de ciudadanía o repatriación.

Los especialistas del Centro para el Estudio de la Historia Judía de Europa del Este de la universidad procesan los materiales enviados al servicio y adaptan el sistema de reconocimiento a las características de cada colección, mejorando la precisión en diferentes estilos de escritura y fuentes históricas.