Ir al menú de navegación principal Ir al contenido principal Ir al pie de página del sitio

SECCIÓN A: CIENCIAS EXACTAS Y FÍSICAS

Vol. 6 Núm. 2 (2014)

Implementación de una red neuronal de convolución para el reconocimiento de poses en imágenes de rostros

DOI
https://doi.org/10.18272/aci.v6i2.167
Enviado
septiembre 30, 2015
Publicado
2014-12-19

Resumen

Las redes neuronales de convolution pertenecen a un conjunto de técnicas agrupadas bajo el aprendizaje profundo, una rama del aprendizaje automático que ha probado ser exitosa en los últimos años en tareas de reconocimiento de imágenes y grabaciones de voz. El presente trabajo explora la utilización de las redes neuronales de convolución en el reconocimiento de imágenes de poses horizontales fuera del plano de rostros. Se propone una implementación basada en las bilbiotecas de código abierto OpenCV para la clasificación de imágenes de rostros humanos dentro de 7 poses predeterminadas y se presenta en detalle la arquitectura de la red y la estrategia de aprendizaje.

La implementación entrenada con conjuntos de 2600 imágenes de cuatro tamaños: 33 × 33, 41 × 41, 65 × 65 y 81 × 81, alcanza una tasa de aciertos promedio del 85% superior a la obtenida con el algoritmo de Rostros Propios cercana al 78%, con un tiempo de ejecución similar.

viewed = 1901 times

Citas

  1. Zhang, C.; Zhang, Z. 2010. "A survey of recent advances in face detection". http://research.microsoft.com/apps/pubs/default.aspx?id=132077, June.
  2. Zhang, X.; Gao, Y. 2009. "Face recognition across pose: A review". Pattern Recognition, 42 (11): 2876-2896.
  3. Hinton, G.; Deng, L.; Yu, D.; Dahl, G.; Mohamed, A.; Jaitly, N.; Senior, A.; Vanhoucke, V.; Nguyen, P; Sainath, T.; Kingsbury, B. 2012. "Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups". IEEE Signal Process. Mag, 29 (6): 82-97.
  4. Hinton, G.; Srivastava, N. 2012. "Improving neural networks by preventing co-adaptation of feature detectors". arXiv preprint: 1-18.
  5. Srivastava, N. 2013. "Improving neural networks with dropout". PhD thesis University of Toronto.
  6. Goodfellow, I.; Warde-Farley, D.; Mirza, M.; Courville, A.; Bengio, Y. 2013. "Maxout networks". ICML.
  7. Phillips, P; Wechsler, H.; Huang, J.; Rauss, P 1998. "The FERET database and evaluation procedure for face-recognition algorithms". Image and Vision Computing, 16 (5): 295-306.
  8. Pesquisa, P; Leonel, L.; Junior, D. 2005. "Relatório Final Captura e Alinhamento de Imagens: Um Banco de Faces Brasileiro". 1-10.
  9. Viola, P; Jones, M. 2001. "Rapid object detection using a boosted cascade of simple features". Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. CVPR, 1: I-511-I-518.
  10. Moon, H.; Phillips, P 2001. "Computational and performance aspects of PCA-based face-recognition algorithms". Perception-London.
  11. Le, Q.; Ngiam, J.; Chen, Z. 2010. "Tiled convolutional neural networks". Advances in Neural: 1-9.
  12. Vatahska, T.; Bennewitz, M.; Behnke, S. 2007. "Feature-based head pose estimation from images". 7th IEEE-RAS International Conference on Humanoid Robots: 330-335.
  13. Bouvrie, J. 2006. "Notes on convolutional neural networks". http://cogprints.org/5869/.
  14. LeCun, Y.; Bottou, L.; Orr, G.; Müller, K. 1998. "Efficient backprop". Neural networks.
  15. O"™Neill, M. 2006. "Neural Network for Recognition of Handwritten Digits". http://www.codeproject.com/Articles/16650/Neural-Network-for-Recognition-of-Handwritten-Digi.
  16. Bradski, G.; Kaehler, A. 2008. "Learning OpenCV: Computer Vision in C++ with the OpenCV Library". O"™Reilly Media, 1st ed. edition.
  17. Pang, S.; Kasabov, N. 2006. "Investigating LLE eigenface on pose and face identification". In Advances in Neural Networks - ISNN 2006, Third International Symposium on Neural Networks, Chengdu, China: 134-139.
  18. Zhao, W.; Chellappa, R.; Phillips, P.; Rosenfeld, A. 2003. "Face recognition". ACM Computing Surveys, 35 (4): 399-458.
  19. García, C.; Delakis, M. 2004. "Convolutional face finder: A neural architecture for fast and robust face detection". IEEE Trans. Pattern Anal. Mach. Intell, 26 (11): 1408-1423.

Artículos más leídos del mismo autor/a