Gavab

Entradas

Defensa de TFM: Estudio de Modelos de Segmentación para el Análisis de Jeroglíficos

En este Trabajo de Fin de Máster, el alumno Jesús del Remedio García Fructuoso aborda el problema de la falta de imágenes reales etiquetadas para el entrenamiento de redes neuronales dedicadas a la detección de instancias (en este caso, jeroglíficos). En concreto, se compararán los modelos clásicos HoG con modelos modernos como la red neuronal YOLO como red de detección de una sola pasada. Algunos de los problemas que son necesarios abordar para resolver el problema son la variedad de tamaños, soportes y formas. Para tratar la falta de imágenes reales etiquetadas se ha desarrollado una herramienta dedicada a la generación de muestra sintética escrito en el lenguaje Python. Gracias a la herramienta se ha obtenido un conjunto de datos en el que además de tener imágenes reales anotadas, también se tienen imágenes sintéticas cuya generación apenas tiene lı́mites.

Defensa de TFM: Un sistema para la verificación de autoría de obras pictóricas basado en técnicas de aprendizaje profundo

El alumno Juan Montes Cano acaba de defender su TFM en el que compara varios modelos para la verificación de autoría de obras pictóricas basados en técnicas de aprendizaje profundo.

Publicación en congreso: A Study on Automatic Analysis of Handwriting Alterations due to Parkinson’s Disease

Publicado como Conference Proceedings en Springer , un artículo presentado en el 23rd EPIA Conference on Artificial Intelligence celebrado en Viana do Castelo (Portugal). En este trabajo se ha utilizado redes convolucionales sobre la base de datos "Parkinson’s Disease Handwriting Database" (PaHaW), que está compuesta por el resultado de diferentes tareas manuscritas efectuadas tanto por pacientes de Parkinson como por sujetos de control. El objetivo de la investigación era el de crear un modelo para detectar y predecir, a nivel de trazo, sílaba y tarea, si un paciente presentaba la enfermedad de Parkinson.

Publicación en revista: A Pix2Pix Architecture for Complete Offline Handwritten Text Normalization

Publicación en Sensors . Este artículo presenta el uso de un modelo entrenable Pix2Pix, un tipo específico de red adversaria generativa condicional, como método para normalizar imágenes de texto escrito a mano. En el ámbito del reconocimiento de texto escrito a mano off-line , a lo largo de los años se han desarrollado numerosos algoritmos de normalización y preprocesamiento antes de aplicar los modelos de reconocimiento automático a imágenes escaneadas de texto manuscrito. Estos algoritmos han demostrado eficacia para mejorar el rendimiento general de las arquitecturas de reconocimiento. Sin embargo, muchos de estos métodos dependen en gran medida de estrategias heurísticas que no se integran perfectamente con la propia arquitectura de reconocimiento. Además, este algoritmo se puede integrar perfectamente como etapa inicial de cualquier arquitectura de aprendizaje profundo diseñada para tareas de reconocimiento escrito a mano. Además, este enfoque facilita el entrenamient...

Contrato de un año en el grupo GAVAB de la URJC para desarrollo de modelos de reconocimiento de texto

Estamos desarrollando un proyecto de investigación financiado por el Ministerio de Economía titulado “ Análisis de Texto Manuscrito para Aplicaciones Digitales de la Sociedad “. Dentro de dicho proyecto se convoca una plaza de investigación durante un año para el desarrollo de modelos de reconocimiento de escritura manuscrita. Inicialmente, el contrato comenzaría en septiembre de 2023. Idealmente, se busca a una persona con grado universitario, con conocimientos de programación, valorándose especialmente los conocimientos en visión artificial y estar estudiando o haber terminado un máster. El periodo de recepción de solicitudes empieza el día 25-04-2023, termina el día 18-05-2023 y la solicitud se puede presentar en está dirección .

Concesión del proyecto HADAS: Análisis de Texto Manuscrito para Aplicaciones Digitales de la Sociedad

Financiado por el MICINN. Este proyecto aborda el problema de la transcripción del texto manuscrito continuo, obtenido desde páginas digitalizadas de documentos genéricos. Considera muchas de las posibles variabilidades implicadas (por ejemplo, la estructura de los documentos donde aparece el texto o las diferencias interpersonales e intrapersonales entre los estilos de escritura). Este problema está lejos de poder resolverse eficazmente de forma automática. Por ello, y debido a sus potenciales aplicaciones, la transcripción y comprensión del contenido de los documentos manuscritos digitalizados seguirá siendo una necesidad importante para nuestra sociedad. Así, este proyecto investiga varios problemas científicos e industriales desafiantes relacionados con el procesamiento automático de texto manuscrito contenido en imágenes digitales de documentos. En particular: (1) el reconocimiento de palabras manuscritas en castellano; (2) la transcripción de documentos históricos; (3) l...

Defensa de TFM: Uso de redes neuronales generativas para la generación de imágenes a partir de texto

TFM publicado en la biblioteca de la URJC. En este trabajo se realiza un estudio de los distintos tipos de GANs y un estado del arte del problema de generación de imágenes a partir de texto. En la parte práctica se han realizado múltiples experimentos, partiendo de problemas sencillos de generación de imágenes hasta llegar a plantear modelos que generen imágenes a partir de texto.