Ir al contenido principal

Entradas

Mostrando entradas de junio, 2022

Defensa de TFG: Detección de Sellos y Logos en Imágenes de Documentos Históricos usando Redes Neuronales Profundas

TFG publicado en la biblioteca de la URJC. Este Trabajo de Fin de Grado ha abordado la problemática de detección de sellos y logos en imágenes de documentos históricos usando las redes neuronales profundas de detección YOLOv5. Este tipo de documentos son muy valiosos para la preservación del patrimonio cultural de los países, y su análisis automático presenta dificultades debido al proceso de digitalización y el borrado de tinta de los documentos, entre otros factores. 

Publicación en congreso: Handwritten Word Recognition on the Fundación-Osborne Dataset

Presentado en el congreso IWINAC 2022 y publicado como artículo en Lecture Notes in Computer Science .   Incluso hoy en día, el reconocimiento de texto manuscrito escaneado constituye un problema de investigación desafiante, especialmente cuando se trata de realizar tareas de reconocimiento en bases de datos históricas.  En este contexto, el objetivo principal del presente trabajo es exponer los resultados obtenidos tras entrenar una red convolucional profunda Seq2Seq con mecanismo de atención utilizando una combinación de imágenes de entrenamiento de palabras tanto de bases de datos contemporáneas como históricas, consiguiendose un error a nivel de palabra inferior al 40%. A la luz de los resultados obtenidos, se discute el efecto del uso de diferentes proporciones de texto moderno e histórico durante el proceso de entrenamiento sobre el rendimiento final del sistema.

Publicación en congreso: Deep Layout Extraction Applied to Historical Postcards

Presentado en el congreso IWINAC 2022 y publicado como artículo en Lecture Notes in Computer Science .  En este trabajo se presenta una arquitectura neuronal profunda para el análisis de la estructura de postales históricas manuscritas.   La arquitectura se basa en una red de neuronas profunda de segmentación semántica que contempla diferentes tipos de categorías como: sellos, matasellos, texto manuscrito, ilustraciones y fondo.  El trabajo consigue unos resultados de acierto superiores al 92% a nivel de píxel.