Ir al contenido principal

Entradas

Publicación en revista: A Pix2Pix Architecture for Complete Offline Handwritten Text Normalization

Publicación en Sensors . Este artículo presenta el uso de un modelo entrenable Pix2Pix, un tipo específico de red adversaria generativa condicional, como método para normalizar imágenes de texto escrito a mano. En el ámbito del reconocimiento de texto escrito a mano off-line , a lo largo de los años se han desarrollado numerosos algoritmos de normalización y preprocesamiento antes de aplicar los modelos de reconocimiento automático a imágenes escaneadas de texto manuscrito.  Estos algoritmos han demostrado eficacia para mejorar el rendimiento general de las arquitecturas de reconocimiento.  Sin embargo, muchos de estos métodos dependen en gran medida de estrategias heurísticas que no se integran perfectamente con la propia arquitectura de reconocimiento. Además, este algoritmo se puede integrar perfectamente como etapa inicial de cualquier arquitectura de aprendizaje profundo diseñada para tareas de reconocimiento escrito a mano. Además, este enfoque facilita el entrenamient...

Contrato de un año en el grupo GAVAB de la URJC para desarrollo de modelos de reconocimiento de texto

Estamos desarrollando un proyecto de investigación financiado por el Ministerio de Economía titulado “ Análisis de Texto Manuscrito para Aplicaciones Digitales de la Sociedad “. Dentro de dicho proyecto se convoca una plaza de investigación durante un año para el desarrollo de modelos de reconocimiento de escritura manuscrita. Inicialmente, el contrato comenzaría en septiembre de 2023. Idealmente, se busca a una persona con grado universitario, con conocimientos de programación, valorándose especialmente los conocimientos en visión artificial y estar estudiando o haber terminado un máster. El periodo de recepción de solicitudes empieza el día 25-04-2023, termina el día 18-05-2023 y la solicitud se puede presentar en está dirección .

Concesión del proyecto HADAS: Análisis de Texto Manuscrito para Aplicaciones Digitales de la Sociedad

Financiado por el MICINN. Este proyecto aborda el problema de la transcripción del texto manuscrito continuo, obtenido desde páginas digitalizadas de documentos genéricos. Considera muchas de las posibles variabilidades implicadas (por ejemplo, la estructura de los documentos donde aparece el texto o las diferencias interpersonales e intrapersonales entre los estilos de escritura). Este problema está lejos de poder resolverse eficazmente de forma automática. Por ello, y debido a sus potenciales aplicaciones, la transcripción y comprensión del contenido de los documentos manuscritos digitalizados seguirá siendo una necesidad importante para nuestra sociedad. Así, este proyecto investiga varios problemas científicos e industriales desafiantes relacionados con el procesamiento automático de texto manuscrito contenido en imágenes digitales de documentos. En particular: (1) el reconocimiento de palabras manuscritas en castellano; (2) la transcripción de documentos históricos; (3) l...

Defensa de TFM: Uso de redes neuronales generativas para la generación de imágenes a partir de texto

TFM publicado en la biblioteca de la URJC. En este trabajo se realiza un estudio de los distintos tipos de GANs y un estado del arte del problema de generación de imágenes a partir de texto. En la parte práctica se han realizado múltiples experimentos, partiendo de problemas sencillos de generación de imágenes hasta llegar a plantear modelos que generen imágenes a partir de texto.  

Defensa de TFG: Neuropaint, evolución de la biblioteca Neurotronik para la representación de redes profundas de neuronas artificiales

TFG publicado en Github y en la biblioteca de la URJC La representación gráfica de las redes de neuronas artificiales profundas tiene un alto interés en el campo científico. Numerosos trabajos científicos que incluyen este tipo de redes son presentados a diario en congresos y revistas de todo el mundo. En este Trabajo de Fin de Grado se proponen una serie de mejoras a la interfaz de usuario de la aplicación NeuroPaint, desarrollada por Marcos Ruiz en el año 2021, que permitía la representación gráfica, en notación AlexNet, de una amplia variedad de redes neuronales profundas. La aplicación desarrollada es de código abierto y este enlace te permite utilizarla.

Defensa de TFG: Predicción Automática de Características Demográficas de Individuos basada en su Escritura Manuscrita

TFG publicado en la biblioteca de la URJC. Este Trabajo de Fin de Grado desarrolla modelos de IA para clasificar textos manuscritos en inglés y árabe según diferentes atributos relativos a los escritores de los escritores. Entre estos atributos se han considerado: el género, la mano de escritura, la lengua materna y el rango de edad. La clasificación de textos manuscritos es una tarea muy importante en sectores como Biometría Forense y Psicología, de cara a sacar conclusiones en base a las características de los escritores. Para realizar esta tarea se han utilizado dos modelos de redes neuronales: una red convolucional sencilla (CNN) y otra más compleja con capas de tipo Inception.   Texto reconocido como de un hombre menor de 20 años (base de datos LAMIS-MSHD)    

Defensa de TFG: Detección de Sellos y Logos en Imágenes de Documentos Históricos usando Redes Neuronales Profundas

TFG publicado en la biblioteca de la URJC. Este Trabajo de Fin de Grado ha abordado la problemática de detección de sellos y logos en imágenes de documentos históricos usando las redes neuronales profundas de detección YOLOv5. Este tipo de documentos son muy valiosos para la preservación del patrimonio cultural de los países, y su análisis automático presenta dificultades debido al proceso de digitalización y el borrado de tinta de los documentos, entre otros factores.