Implementación de una red neuronal de convolución para el reconocimiento de poses en imágenes de rostros

Paul Méndez; Julio Ibarra

doi:10.18272/aci.v6i2.167

SECCIÓN A: CIENCIAS EXACTAS

Vol. 6 Núm. 2 (2014)

Implementación de una red neuronal de convolución para el reconocimiento de poses en imágenes de rostros

Paul Méndez⁺⁻
Julio Ibarra⁺⁻

PDF
1605

DOI: https://doi.org/10.18272/aci.v6i2.167
Enviado: septiembre 30, 2015
Publicado: 2014-12-19

Resumen

Las redes neuronales de convolution pertenecen a un conjunto de técnicas agrupadas bajo el aprendizaje profundo, una rama del aprendizaje automático que ha probado ser exitosa en los últimos años en tareas de reconocimiento de imágenes y grabaciones de voz. El presente trabajo explora la utilización de las redes neuronales de convolución en el reconocimiento de imágenes de poses horizontales fuera del plano de rostros. Se propone una implementación basada en las bilbiotecas de código abierto OpenCV para la clasificación de imágenes de rostros humanos dentro de 7 poses predeterminadas y se presenta en detalle la arquitectura de la red y la estrategia de aprendizaje.

La implementación entrenada con conjuntos de 2600 imágenes de cuatro tamaños: 33 Ã— 33, 41 Ã— 41, 65 Ã— 65 y 81 Ã— 81, alcanza una tasa de aciertos promedio del 85% superior a la obtenida con el algoritmo de Rostros Propios cercana al 78%, con un tiempo de ejecución similar.

viewed = 2067 times

Citas

Zhang, C.; Zhang, Z. 2010. "A survey of recent advances in face detection". http://research.microsoft.com/apps/pubs/default.aspx?id=132077, June.
Zhang, X.; Gao, Y. 2009. "Face recognition across pose: A review". Pattern Recognition, 42 (11): 2876-2896.
Hinton, G.; Deng, L.; Yu, D.; Dahl, G.; Mohamed, A.; Jaitly, N.; Senior, A.; Vanhoucke, V.; Nguyen, P; Sainath, T.; Kingsbury, B. 2012. "Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups". IEEE Signal Process. Mag, 29 (6): 82-97.
Hinton, G.; Srivastava, N. 2012. "Improving neural networks by preventing co-adaptation of feature detectors". arXiv preprint: 1-18.
Srivastava, N. 2013. "Improving neural networks with dropout". PhD thesis University of Toronto.
Goodfellow, I.; Warde-Farley, D.; Mirza, M.; Courville, A.; Bengio, Y. 2013. "Maxout networks". ICML.
Phillips, P; Wechsler, H.; Huang, J.; Rauss, P 1998. "The FERET database and evaluation procedure for face-recognition algorithms". Image and Vision Computing, 16 (5): 295-306.
Pesquisa, P; Leonel, L.; Junior, D. 2005. "Relatório Final Captura e Alinhamento de Imagens: Um Banco de Faces Brasileiro". 1-10.
Viola, P; Jones, M. 2001. "Rapid object detection using a boosted cascade of simple features". Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. CVPR, 1: I-511-I-518.
Moon, H.; Phillips, P 2001. "Computational and performance aspects of PCA-based face-recognition algorithms". Perception-London.
Le, Q.; Ngiam, J.; Chen, Z. 2010. "Tiled convolutional neural networks". Advances in Neural: 1-9.
Vatahska, T.; Bennewitz, M.; Behnke, S. 2007. "Feature-based head pose estimation from images". 7th IEEE-RAS International Conference on Humanoid Robots: 330-335.
Bouvrie, J. 2006. "Notes on convolutional neural networks". http://cogprints.org/5869/.
LeCun, Y.; Bottou, L.; Orr, G.; MÃ¼ller, K. 1998. "Efficient backprop". Neural networks.
O"™Neill, M. 2006. "Neural Network for Recognition of Handwritten Digits". http://www.codeproject.com/Articles/16650/Neural-Network-for-Recognition-of-Handwritten-Digi.
Bradski, G.; Kaehler, A. 2008. "Learning OpenCV: Computer Vision in C++ with the OpenCV Library". O"™Reilly Media, 1st ed. edition.
Pang, S.; Kasabov, N. 2006. "Investigating LLE eigenface on pose and face identification". In Advances in Neural Networks - ISNN 2006, Third International Symposium on Neural Networks, Chengdu, China: 134-139.
Zhao, W.; Chellappa, R.; Phillips, P.; Rosenfeld, A. 2003. "Face recognition". ACM Computing Surveys, 35 (4): 399-458.
García, C.; Delakis, M. 2004. "Convolutional face finder: A neural architecture for fast and robust face detection". IEEE Trans. Pattern Anal. Mach. Intell, 26 (11): 1408-1423.

Palabras clave

Red neuronal de convolución
red neuronal profunda
reconocimiento de rostros
poses
aprendizaje profundo

Cómo citar

Méndez, P., & Ibarra, J. (2014). Implementación de una red neuronal de convolución para el reconocimiento de poses en imágenes de rostros. ACI Avances En Ciencias E Ingenierías, 6(2). https://doi.org/10.18272/aci.v6i2.167

Aviso de derechos de autor/a

Descargas

Los datos de descargas todavía no están disponibles.

Artículos más leídos del mismo autor/a

Bolivar Efraín Morales Oñate, Carlos Jiménez-Mosquera, Paúl Mendéz, Una alternativa a Stata: usando R para estimación de Modelos de Regresión , ACI Avances en Ciencias e Ingenierías: Vol. 11 Núm. 2 (2019)

[1] Zhang, C.; Zhang, Z. 2010. "A survey of recent advances in face detection". http://research.microsoft.com/apps/pubs/default.aspx?id=132077, June.

[2] Zhang, X.; Gao, Y. 2009. "Face recognition across pose: A review". Pattern Recognition, 42 (11): 2876-2896.

[3] Hinton, G.; Deng, L.; Yu, D.; Dahl, G.; Mohamed, A.; Jaitly, N.; Senior, A.; Vanhoucke, V.; Nguyen, P; Sainath, T.; Kingsbury, B. 2012. "Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups". IEEE Signal Process. Mag, 29 (6): 82-97.

[4] Hinton, G.; Srivastava, N. 2012. "Improving neural networks by preventing co-adaptation of feature detectors". arXiv preprint: 1-18.

[5] Srivastava, N. 2013. "Improving neural networks with dropout". PhD thesis University of Toronto.

[6] Goodfellow, I.; Warde-Farley, D.; Mirza, M.; Courville, A.; Bengio, Y. 2013. "Maxout networks". ICML.

[7] Phillips, P; Wechsler, H.; Huang, J.; Rauss, P 1998. "The FERET database and evaluation procedure for face-recognition algorithms". Image and Vision Computing, 16 (5): 295-306.

[8] Pesquisa, P; Leonel, L.; Junior, D. 2005. "Relatório Final Captura e Alinhamento de Imagens: Um Banco de Faces Brasileiro". 1-10.

[9] Viola, P; Jones, M. 2001. "Rapid object detection using a boosted cascade of simple features". Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. CVPR, 1: I-511-I-518.

[10] Moon, H.; Phillips, P 2001. "Computational and performance aspects of PCA-based face-recognition algorithms". Perception-London.

[11] Le, Q.; Ngiam, J.; Chen, Z. 2010. "Tiled convolutional neural networks". Advances in Neural: 1-9.

[12] Vatahska, T.; Bennewitz, M.; Behnke, S. 2007. "Feature-based head pose estimation from images". 7th IEEE-RAS International Conference on Humanoid Robots: 330-335.

[13] Bouvrie, J. 2006. "Notes on convolutional neural networks". http://cogprints.org/5869/.

[14] LeCun, Y.; Bottou, L.; Orr, G.; MÃ¼ller, K. 1998. "Efficient backprop". Neural networks.

[15] O"™Neill, M. 2006. "Neural Network for Recognition of Handwritten Digits". http://www.codeproject.com/Articles/16650/Neural-Network-for-Recognition-of-Handwritten-Digi.

[16] Bradski, G.; Kaehler, A. 2008. "Learning OpenCV: Computer Vision in C++ with the OpenCV Library". O"™Reilly Media, 1st ed. edition.

[17] Pang, S.; Kasabov, N. 2006. "Investigating LLE eigenface on pose and face identification". In Advances in Neural Networks - ISNN 2006, Third International Symposium on Neural Networks, Chengdu, China: 134-139.

[18] Zhao, W.; Chellappa, R.; Phillips, P.; Rosenfeld, A. 2003. "Face recognition". ACM Computing Surveys, 35 (4): 399-458.

[19] García, C.; Delakis, M. 2004. "Convolutional face finder: A neural architecture for fast and robust face detection". IEEE Trans. Pattern Anal. Mach. Intell, 26 (11): 1408-1423.