Minería de datos educativa con Weka: aplicaciones y modelado predictivo
Resumen
El presente trabajo tiene como objetivo explorar la aplicación de la minería de datos educativa para mejorar las técnicas de enseñanza y aprendizaje con base en el análisis de datos obtenidos por medio de un cuestionario. Para ello, se utiliza el software libre Weka 3.8.6, que permite el preprocesamiento, regresión y agrupamiento de datos educativos, facilitando la identificación de patrones y elementos clave en el aprovechamiento académico. La metodología incluye la preparación del conjunto de datos en formato compatible para su análisis, la aplicación de filtros para limpieza y transformación de los datos, y el uso del modelo predictivo de regresión M5P de Weka basado en árboles de decisión, para analizar variables relevantes como ausencias escolares, edad, y participación en actividades extracurriculares. Entre los principales hallazgos, se destaca la capacidad del modelo para predecir el rendimiento académico con una correlación moderada, lo que ayuda a identificar estudiantes que se encuentran en riesgo y apoyar la toma de decisiones didácticas. Estos resultados evidencian que la minería de datos puede influir significativamente a la personalización del aprendizaje y al progreso continuo de los métodos de enseñanza. La integración de estas técnicas representa un recurso clave en el contexto educativo de México, para reforezar la toma de decisiones didácticas y también para impulsar la equidad de oportunidades académicas.
Descargas
Citas
Andrade-Girón, C. A., Yepes-Gómez, J. D., Toloza-Ruíz, C. J., & Durán-Moreno, A. A. (2023). Machine and deep learning algorithms for early dropout prediction in higher education: A systematic review. EAI Endorsed Transactions on Scalable Information Systems, 10(2), e6. https://doi.org/10.4108/eetsis.3586.
Bhatt, C., Sajja, P. S., & Liyanage, S. (Eds.). (2020). Utilizing educational data mining techniques for improved learning: Emerging research and opportunities. IGI Global. https://doi.org/10.4018/978-1-7998-0010-1.
Bouckaert, R. R., Frank, E., Hall, M., Kirkby, R., Reutemann, P., Seewald, A., & Scuse, D. (2018, September 4). WEKA manual for version 3-8-3. University of Waikato. https://user.eng.umd.edu/~austin/ence688p.d/handouts/WekaManual2018.pdf.
Cedillo Arce, J. M., Beltrán Abreo, H. M., Saltos Arce, M. I., & Soriano Barzola, F. R. (2024). Explorando la minería de datos en la gestión educativa superior: desafíos y oportunidades en la era digital. Reincisol, 3(5), 1368–1385. https://doi.org/10.59282/reincisol.V3(5)1367-1385.
Cerón Garnica, C., Moyao Martínez, Y., Martínez Guzmán, G., y Mila Avendaño, V. M. (2025). Análisis de los Recursos Educativos Abiertos en el rezago de aprendizajes en el bachillerato postpandemia. EDUCATECIENCIA, 33(2), 1-33. https://educateconciencia.com/index.php/revistaeducate/article/view/380
Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., & Witten, I. H. (2019). WEKA 3.8.6 [Software]. Universidad de Waikato. https://www.cs.waikato.ac.nz/ml/weka/.
Han, J., Kamber, M., & Pei, J. (2012). Data mining: Concepts and techniques (3rd ed.). Morgan Kaufmann. https://doi.org/10.1016/C2009-0-61819-5.
Information Resources Management Association. (2018). Information Retrieval and Management: Concepts, Methodologies, Tools, and Applications (4 vols.). IGI Global. https://doi.org/10.4018/978-1-5225-5191-1.
Lampropoulos, G. (2023). Educational data mining and learning analytics in the 21st century. En Encyclopedia of data science and machine learning (pp. 1642–1651). IGI Global. https://doi.org/10.4018/978-1-7998-9220-5.ch098.
Ordoñez-Avila, R., Salgado Reyes, N., Meza, J., & Ventura, S. (2023). Data mining techniques for predicting teacher evaluation in higher education: A systematic literature review. Heliyon, 9(3), e13939. https://doi.org/10.1016/j.heliyon.2023.e13939.
Romero, C., & Ventura, S. (2024). Educational data mining and learning analytics: An updated survey. Journal of Educational Data Mining. https://doi.org/10.1002/widm.1355.
University of Waikato. (s. f.). https://www.cs.waikato.ac.nz/ml/weka/.
Witten, I. H., Frank, E., & Hall, M. A. (2011). Data Mining: Practical Machine Learning Tools and Techniques (3rd ed.). Morgan Kaufmann. https://dl.acm.org/doi/book/10.5555/1972514.
Cespedes Morai, J. M., & Oliver Chag, A. (2023). El Impacto de la Educación Virtual en el Rendimiento Académico: Un Estudio Longitudinal en Estudiantes de Ciencias Sociales. Ciencia Y Reflexión, 2(1), 14–28. https://doi.org/10.70747/cr.v2i1.15
Urquidez Romero , R., Avitia Sánchez, A., Cano Ramírez , D., Jiménez Montes , L. V., Barranco Merino, G. I., & Reyes Ruvalcaba, D. (2025). Programa de Intervención con un Suplemento Multivitamínico para Mejorar el Estado de Nutrición y Anemia en Niños en Condición de Vulnerabilidad Social de Ciudad Juárez Chihuahua. Ciencia Latina Revista Científica Multidisciplinar, 9(3), 8340-8354. https://doi.org/10.37811/cl_rcm.v9i3.18460
Jiménez Rodríguez, J. M. (2024). Euthanasia In Spain: An Interpretive Analysis Of The Current Regulations From The Health Social Work. Ciencia Y Reflexión, 3(2), 1–20. https://doi.org/10.70747/cr.v3i2.4
Tenesaca Canchignia , D. C., Canchignia Bonilla, E. L., Remache Guamán, N. V., Guamán Sagñay , H. P., & Hualcopo Duchicela, U. E. (2025). Guía para padres con respecto al uso de dispositivos móviles el niños de nivel preparatorio. Arandu UTIC, 12(2), 287–307. https://doi.org/10.69639/arandu.v12i2.925
Araujo García, D., Chang Espinosa , O. Y., & Pérez Vázquez , D. (2025). Consultoría Estratégica para Mipymes: Estudio de Mercado para Impulsar el Desarrollo Regional en Perote, Veracruz. Estudios Y Perspectivas Revista Científica Y Académica , 5(3), 27–45. https://doi.org/10.61384/r.c.a.v5i3.1328
Simbaña Cabrera, H. A., Haro Jácome, O. F., García-Romero , C. A., & Analuisa García , P. S. (2025). La titulación rural, una propuesta colectiva que evidencia la realidad educativa de las escuelas multigrado. Emergentes - Revista Científica, 5(2), 1–14. https://doi.org/10.60112/erc.v5.i2.385
Cortés Viveros, N., Hernández García, R. A., Galván Sarabia, A., Olivares Galvan, H. R., & Texon Olguin, O. A. (2025). En Busca del Modelo Ideal para Determinar las Variables que Explican el Tiempo de Desempleo en Buscadores Xalapeños. Estudios Y Perspectivas Revista Científica Y Académica , 5(3), 65–81. https://doi.org/10.61384/r.c.a.v5i3.1332
Bernal Parraga, A. P., Salazar Véliz , E. T., Zambrano Lamilla, L. M., Espinoza Jaramillo , S. G., Morales García , C. S., Shinger Hipatia, N. S., & Zapata Calderón , S. J. (2025). Innovaciones Didácticas para Lengua y Literatura Basadas en el Aprendizaje Personalizado y Colaborativo . Revista Científica De Salud Y Desarrollo Humano , 6(2), 01–32. https://doi.org/10.61368/r.s.d.h.v6i2.574
Sabando Suárez, A. A., Vega Guamangate, J. M., García Gallirgos, V. J., & Mora Carpio, W. T. (2025). Impacto del Gasto Social en el Índice de Desarrollo Humano en Ecuador. periodo 2001-2023. Revista Veritas De Difusão Científica, 6(2), 1593–1633. https://doi.org/10.61616/rvdc.v6i2.707
Derechos de autor 2025 Yolanda Moyao Martínez

Esta obra está bajo licencia internacional Creative Commons Reconocimiento 4.0.











.png)
















.png)
1.png)

