Reconocimiento de la Lengua de Señas Mexicana Usando Deep Learning Mediante una Aplicación Móvil
Resumen
El reconocimiento de la Lengua de Señas Mexicana (LSM) mediante algoritmos de Machine Learning (ML) ha sido mayormente estudiado en computadoras personales, habiendo menos trabajos enfocados en plataformas móviles. Este estudio tuvo como objetivo evaluar el reconocimiento de señas fijas y con movimiento de LSM mediante una Aplicación móvil, para las señas fijas se entrenó una red neuronal (RN) del tipo Perceptrón Multi Capa (en inglés Multi Layer Perceptron, MLP) con 137,764 imágenes. Para reconocer señas con movimiento, se entrenaron tres RN: Memoria Larga a Corto Plazo (en inglés Long Short Term Memory, LSTM), Unidad Recurrente Cerrada (en inglés Gated Recurrent Unit, GRU) y Transformer, compuesto con una Red Neuronal Convolucional (en inglés Convolutional Neural Network, CNN) y una LSTM, con datos de 1600 videos de 16 señas. En el entrenamiento el modelo MLP logró un 96.2% de Accuracy, mientras que el modelo Transformer tuvo el mejor desempeño en señas con movimiento con 94.16% de Accuracy. En la Aplicación, el reconocimiento de señas fijas fue más preciso a 50 cm de distancia, con tiempo de inferencia de 0.60 milisegundos y un uso de memoria de 116 bytes por fotograma. Las señas con movimiento de ambas manos lograron una precisión superior al 93%, con tiempo de inferencia de 286 milisegundos y un uso máximo de 1 Mb de memoria. Estos hallazgos pueden aportar información potencial para el desarrollo de una herramienta de traducción de la LSM, que puede impactar significativamente en la vida de las personas con discapacidad auditiva
Descargas
Citas
Chow, G. Cameron, M. Sherwood, P. Culliton, S. Sepah, S. Dane, & T. Starner. (2023). Google - Isolated Sign Language Recognition. Kaggle.
https://kaggle.com/competitions/asl-signs . Consultado en septiembre 2024.
Aquino Castro R.A. (2018). Reconocimiento e interpretación del alfabeto dactilológico de la lengua de señas mediante tecnología móvil y redes neuronales artificiales. (Tesis inédita de licenciatura). Universidad Mayor De San Andrés, Facultad De Ciencias Puras Y Naturales Carrera De Informática, La Paz, Bolivia.
Berea Barcia, C. (2021). Reconocimiento del alfabeto de lenguaje de señas. (Tesis inédita de licenciatura). Universidad Autónoma de Barcelona, Barcelona, España.
Borja-Robalino, R., Monleon-Getino, A., & Rodellar, J. (2020). Estandarización de métricas de rendimiento para clasificadores Machine y Deep Learning. Revista Ibérica de Sistemas e Tecnologias de Informação, (E30), 184-196.
Cámara de Diputados (10 de febrero de 2021). Aprueban reformas para que personas con discapacidad auditiva reciban educación bilingüe en lengua de señas.
https://comunicacionnoticias.diputados.gob.mx/comunicacion/index.php/boletines/aprueban-reformas-para-que-personas-con-discapacidad-auditiva-reciban-educacion-biling-e-en-lengua-de-se-as#gsc.tab=0 , fecha de consulta: 19 de octubre de 2022.
Cruz Aldrete, M. (2008). Gramática de la Lengua de Señas Mexicana. (Tesis de doctorado, Colegio de México. Recuperado de https://repositorio.colmex.mx/concern/theses/kk91fk72t?locale=es cruz_m_000203845.pdf
Cruz Aldrete, M. (2014). Hacia la construcción de un diccionario de Lengua de Señas Mexicana. Revista de Investigación 38(83), 57-80. Recuperado de
http://ve.scielo.org/scielo.php?script=sci_arttext&pid=S1010-29142014000300005&lng=es&tlng=es. Consultado en 06 de octubre de 2024.
Cruz, Y.J., Rivas, M., Quiza, R., Villalonga, A., Haber, R.E., & Beruvides, G. (2021). Ensemble of convolutional neural networks based on an evolutionary algorithm applied to an industrial welding process. Computers in Industry. 133. doi:10.1016/j.compind.2021.103530.
Espejel, J. (2021). Desarrollo de algoritmos para traductor automático de lenguaje de señas mexicanas (LSM). Repositorio Institucional Universidad Autónoma del Estado de México.
http://hdl.handle.net/20.500.11799/111836
Salgado Martínez, G. A., Cuevas Valencia, R. E., Feliciano Morales, A., & Catalán Villegas, A. (2024). Reconocimiento de señas de la Lengua de Señas Mexicana mediante técnicas de Machine Learning. XIKUA Boletín Científico De La Escuela Superior De Tlahuelilpan, 12 (Especial), 33-39.
https://doi.org/10.29057/xikua.v12iEspecial.12696
Gallego Peralta D. (2021). Intérprete del lenguaje de signos en tiempo real mediante Machine Learning. (Tesis inédita de licenciatura). Universidad de Málaga, Escuela Técnica Superior De Ingeniería Informática, Málaga, España.
Gobierno de México. (2016). La dificultad de las personas con discapacidad auditiva para comunicarse con los demás, dificulta su desarrollo educativo, profesional y humano, por consecuencia se ven limitadas sus oportunidades de inclusión. Consejo Nacional para el Desarrollo y la Inclusión de las Personas con Discapacidad.
https://www.gob.mx/conadis/articulos/lengua-de-senas-mexicana-lsm?idiom=es#:~:text=La%20Lengua%20de%20Se%C3%B1as%20Mexicana,propia%20sintaxis%2C%20gram%C3%A1tica%20y%20l%C3%A9xico , consultado en octubre de 2024.
Instituto Nacional de Estadística y Geografía. (2020). Población con discapacidad o limitación en la actividad cotidiana por entidad federativa y tipo de actividad realiza según sexo, 2020. https://www.inegi.org.mx/app/tabulados/interactivos/?pxq=Discapacidad_Discapacidad_02_2c111b6a-6152-40ce-bd39-6fab2c4908e3&idrt=151&opc=t, consultado en octubre de 2024.
Jin, M., Omar, Z. & Hisham M. (2016). A Mobile Application of American Sign Language
Translation via Image Processing Algorithms. 2016 IEEE Region 10 Symposium, DOI: 10.1109/TENCONSpring.2016.7519386
Kaggle. (2024). Google - Isolated Sign Language Recognition. 1st place code with reproducibility. Kaggle.
https://www.kaggle.com/competitions/asl-signs/discussion/406978. Consultado en septiembre 2024.
Cho, B. van Merrienboer, DZ. Bahdanau, F. Bougares, H. Schwenk, Y. Bengio. (2014). "Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation". Association for Computational Linguistics.
Luna Buendia Y. & Minajas Carbajal F. J. (2016). Sistema de reconocimiento del alfabeto del Lenguaje de Señas Mexicano usando dispositivos móviles. (Tesis inédita de licenciatura). Instituto Politécnico Nacional, Escuela Superior de Cómputo, Ciudad de México, México.
Martinez-Alpiste, I., Golcarenarenji, G., Wang, Q. & Alcaráz-Calero, J.M. (2022). Smartphone-based real-time object recognition architecture for portable and constrained systems. J Real-Time Image Proc 19, 103–115. https://doi.org/10.1007/s11554-021-01164-1
MediaPipe. (2024). MediaPipe Hands.
https://github.com/google-ai-edge/mediapipe/blob/master/docs/solutions/hands.md, fecha de consulta: septiembre 2024.
Mejía-Peréz, K., Córdova-Esparza, D. M., Terven, J.,Herrera-Navarro, A. M., García-Ramírez, T., Ramírez-Pedraza, A. (2022). Automatic Recognition of Mexican Sign Language Using a Depth Camera and Recurrent Neural Networks. Appl. Sci. 2022, 12, 5523.
https://doi.org/10.3390/app12115523
Pinzón Bayona G. & Sanabria Orjuela Y. G. (2021). Desarrollo de una aplicación móvil para traductor de lenguaje de señas mediante el uso de servicios web. (Tesis inédita de licenciatura). Universidad Católica De Colombia, Facultad De Ingeniería, Ingeniería De Sistemas Y Computación, Bogotá, Colombia.
Pérez, J. & Cruz, J. (2020). Experiencias de Inclusión-Exclusión de un Grupo de Sordos Usuarios de la Lengua de Señas Mexicana. Revista Latinoamericana de Educación Inlcusiva, 15(1), pp. 39-54. DOI:
https://doi.org/10.4067/s0718-73782021000100039
S. Hochreiter, J. Schmidhuber (1997). "Long short-term memory". Neural Computation. 9 (8): 1735–1780. doi:10.1162/neco.1997.9.8.1735. PMID 9377276. S2CID 1915014.
Scikit-learn. (2024). Metrics and scoring: quantifying the quality of predictions. Recuperado de https://scikit-learn.org/1.5/modules/model_evaluation.html#classification-metrics. Consultado en septiembre de 2024.
Van Houdt, G., Mosquera, C. & Nápoles, G. (2020). A review on the long short-term memory model. Artif Intell Rev 53, 5929–5955. https://doi.org/10.1007/s10462-020-09838-1
Derechos de autor 2024 Gabriel Alejandro Salgado Martínez, René Edmundo Cuevas Valencia, Angelino Feliciano Morales, Arnulfo Catalán Villegas
Esta obra está bajo licencia internacional Creative Commons Reconocimiento 4.0.