Ir al contenido principal

Entradas

Mostrando entradas de 2018

Publicación en revista: Multiview 3D human pose estimation using improved least-squares and LSTM networks

Publicado en Neurocomputing En este artículo se presenta un método para estimar la pose del cuerpo humano en 3D a partir de múltiples vistas 2D utilizando aprendizaje profundo. El sistema está formado una sucesión de subsistemas. Primeramente, se obtienen las poses 2D usando una red de neuronas profunda que detecta los puntos claves de un esqueleto simplificado del cuerpo en las vistas disponibles. Luego, se recosntruyen las coordenadas 3D de cada punto utilizando una propuesta original, basada en optimización de mínimos cuadrados, que analiza la calidad de las anteriores detecciones 2D para decidir si aceptarlas o no. Una vez que se dispone de las poses 3D, se estima la posición completa del cuerpo, teniendo en cuenta la historia pasada para refinarla mediante una red LSTM. En la parte experimental, el artículo ofrece unos resultados competitivos cuando se compara con trabajos representativos de la literatura. In this paper we present a deep learning based method to estimate the

Publicación en congreso: Una metodología para la realización y evaluación efectiva de exámenes de programación usando el ordenador

Publicado en el congreso JENUI 2018 . El uso de ordenadores durante los exámenes de programación es una demanda muy habitual entre los estudiantes universitarios. En este trabajo se presenta una metodología para evaluar a los estudiantes de un curso de programación, que incorpora como novedad principal el uso del ordenador, por parte de los estudiantes, durante el examen. El trabajo comienza justificando las ventajas del uso del ordenador durante el examen y explicando los retos que introduce. Luego, se describen los diferentes procedimientos que componen la metodología propuesta: prácticas en casa, test unitarios, exámenes prácticos y exámenes tipo test. También se describen en este trabajo dos herramientas que se han desarrollado ad-hoc para complementar dicha metodología. La primera herramienta tiene por objetivo impedir el uso fraudulento del ordenador durante el examen. La segunda herramienta sirve para semiautomatizar la corrección de los exámenes. Finalmente, en

Publicación en congreso: Situation Awareness Cognitive Agent for Vehicle Geolocation in Tunnels

Publicado en Communications in Computer and Information Science The integration of geolocation, big data and cognitive agents has become one of the most boosting business tools of the digital era. By definition, geolocation represents the use of different technologies in a variety of applications to help locate humans and objects. To really achieve smart services, companies also require accessing huge volumes of related information to draw meaningful conclusions. With big data, it is possible to establish connections between a wide range of associated information, and use it to improve available services or create new ones. Today, the influence of geolocation, cloud data science and involved cognitive agents impacts many application fields, which include: safety and security, marketing, beacon technology, geofencing, location-sensitive services, transportation and logistics, healthcare, urban governance, intelligent buildings and smart cities, intelligent transport systems, advanced

Convolutional Neural Networks and Long Short-Term Memory for skeleton-based human activity and hand gesture recognition

Publicado en Patter Recognition ( PDF ) En este trabajo, abordamos los problemas de la actividad humana y el reconocimiento de los gestos de las manos utilizando secuencias de datos en 3D obtenidas a partir de esqueletos de cuerpo entero y de manos, respectivamente. Para ello, proponemos un enfoque basado en el aprendizaje profundo para que el 3D temporal plantee problemas de reconocimiento basado en la combinación de una Red Neural Convolucional (CNN) y una red recurrente de Larga Memoria a Corto Plazo (LSTM). También presentamos una estrategia de formación en dos etapas que, en primer lugar, se centra en la formación de CNN y, en segundo lugar, ajusta el método completo (CNN+LSTM). Las pruebas experimentales demostraron que nuestro método de entrenamiento obtiene mejores resultados que una estrategia de entrenamiento de una sola etapa. Además, proponemos un método de aumento de datos que también ha sido validado experimentalmente. Por último, realizamos un amplio estudio experiment

Publicación en congreso: A deep learning approach to handwritten number recognition

Publicado en Lecture Notes in Computer Science Abstract Nowadays, Deep Learning is one of the most popular techniques which is used in several fields like handwriting text recognition. This paper presents our propose for a handwritten digit sequences recognition system. Our system, based in two stage model, is composed by Convolutional Neural Networks and Recurrent Neural Networks. Moreover, it is trained using on-demand scheme to recognize numbers from digits of the MNIST dataset. We will see that, with these training samples is not necessary segment or normalize the input images. Average recognition results were on 88,6% of accuracy in numbers of variable-length, between 1 and 10 digits. This accuracy is independent on the number length. Moreover, in most of the wrongly predicted numbers there was only one digit error.

Publicación en revista: Offline continuous handwriting recognition using sequence to sequence neural networks

Publicado en Neurocomputing Abstract This paper proposes the use of a new neural network architecture that combines a deep convolutional neural network with an encoder–decoder, called sequence to sequence, to solve the problem of recognizing isolated handwritten words. The proposed architecture aims to identify the characters and contextualize them with their neighbors to recognize any given word. Our model proposes a novel way to extract relevant visual features from a word image. It combines the use of a horizontal sliding window, to extract image patches, and the application of the LeNet-5 convolutional architecture to identify the characters. Extracted features are modeled using a sequence-to-sequence architecture to encode the visual characteristics and then to decode the sequence of characters in the handwritten text image. We test the proposed model on two handwritten databases (IAM and RIMES) under several experiments to determine the optimal parameterization of the model. C

Publicación en revista: Gender and Handedness Prediction from Offline Handwriting using Convolutional Neural Networks

Publicado en Complexity Abstract Demographic handwriting-based classification problems, such as gender and handedness categorizations, present interesting applications in disciplines like Forensic Biometrics. This work describes an experimental study on the suitability of deep neural networks to three automatic demographic problems: gender, handedness, and combined gender-and-handedness classifications, respectively. Our research was carried out on two public handwriting databases: the IAM dataset containing English texts and the KHATT one with Arabic texts. The considered problems present a high intrinsic difficulty when extracting specific relevant features for discriminating the involved subclasses. Our solution is based on convolutional neural networks since these models had proven better capabilities to extract good features when compared to hand-crafted ones. Our work also describes the first approach to the combined gender-and-handedness prediction, which has not been addres