Concesión del proyecto HADAS: Análisis de Texto Manuscrito para Aplicaciones Digitales de la Sociedad
Financiado por el MICINN.
Este proyecto aborda el problema de la transcripción del texto manuscrito continuo, obtenido desde páginas digitalizadas de documentos genéricos. Considera muchas de las posibles variabilidades implicadas (por ejemplo, la estructura de los documentos donde aparece el texto o las diferencias interpersonales e intrapersonales entre los estilos de escritura). Este problema está lejos de poder resolverse eficazmente de forma automática.
Por ello, y debido a sus potenciales
aplicaciones, la transcripción y comprensión del contenido de los
documentos manuscritos digitalizados seguirá siendo una necesidad
importante para nuestra sociedad. Así, este proyecto investiga varios
problemas científicos e industriales desafiantes relacionados con el
procesamiento automático de texto manuscrito contenido en imágenes
digitales de documentos. En particular: (1) el reconocimiento de
palabras manuscritas en castellano; (2) la transcripción de documentos
históricos; (3) la detección de algunos síntomas de enfermedades
neuromotoras (por ejemplo, Parkinson) utilizando textos manuscritos; y
(4) la detección de falsificaciones hábiles en la verificación de
firmas, respectivamente. Los resultados obtenidos en los problemas
investigados se transformarán publicaciones científicas y en
aplicaciones de software libre para su posible transferencia industrial o
social. En general, en este proyecto enfocaremos especialmente los
desarrollos al idioma español, empezando con la creación de varios
conjuntos de datos anotados, para los problemas considerados, que se
pondrán a disposición de la comunidad investigadora.