Ir al contenido principal

Concesión del proyecto HADAS: Análisis de Texto Manuscrito para Aplicaciones Digitales de la Sociedad

Financiado por el MICINN.

Este proyecto aborda el problema de la transcripción del texto manuscrito continuo, obtenido desde páginas digitalizadas de documentos genéricos. Considera muchas de las posibles variabilidades implicadas (por ejemplo, la estructura de los documentos donde aparece el texto o las diferencias interpersonales e intrapersonales entre los estilos de escritura). Este problema está lejos de poder resolverse eficazmente de forma automática.

Por ello, y debido a sus potenciales aplicaciones, la transcripción y comprensión del contenido de los documentos manuscritos digitalizados seguirá siendo una necesidad importante para nuestra sociedad. Así, este proyecto investiga varios problemas científicos e industriales desafiantes relacionados con el procesamiento automático de texto manuscrito contenido en imágenes digitales de documentos. En particular: (1) el reconocimiento de palabras manuscritas en castellano; (2) la transcripción de documentos históricos; (3) la detección de algunos síntomas de enfermedades neuromotoras (por ejemplo, Parkinson) utilizando textos manuscritos; y (4) la detección de falsificaciones hábiles en la verificación de firmas, respectivamente. Los resultados obtenidos en los problemas investigados se transformarán publicaciones científicas y en aplicaciones de software libre para su posible transferencia industrial o social. En general, en este proyecto enfocaremos especialmente los desarrollos al idioma español, empezando con la creación de varios conjuntos de datos anotados, para los problemas considerados, que se pondrán a disposición de la comunidad investigadora.