Minería de datos educativa con Weka: aplicaciones y modelado predictivo

Palabras clave: minería de datos educativa, modelado predictivo, weka, rendimiento académico

Resumen

El presente trabajo tiene como objetivo explorar la aplicación de la minería de datos educativa para mejorar las técnicas de enseñanza y aprendizaje con base en el análisis de datos obtenidos por medio de un cuestionario. Para ello, se utiliza el software libre Weka 3.8.6, que permite el preprocesamiento, regresión y agrupamiento de datos educativos, facilitando la identificación de patrones y elementos clave en el aprovechamiento académico. La metodología incluye la preparación del conjunto de datos en formato compatible para su análisis, la aplicación de filtros para limpieza y transformación de los datos, y el uso del modelo predictivo de regresión M5P de Weka basado en árboles de decisión, para analizar variables relevantes como ausencias escolares, edad, y participación en actividades extracurriculares. Entre los principales hallazgos, se destaca la capacidad del modelo para predecir el rendimiento académico con una correlación moderada, lo que ayuda a identificar estudiantes que se encuentran en riesgo y apoyar la toma de decisiones didácticas. Estos resultados evidencian que la minería de datos puede influir significativamente a la personalización del aprendizaje y al progreso continuo de los métodos de enseñanza. La integración de estas técnicas representa un recurso clave en el contexto educativo de México, para reforezar la toma de decisiones didácticas y también para impulsar la equidad de oportunidades académicas.

Descargas

La descarga de datos todavía no está disponible.

Citas

Andrade-Girón, C. A., Yepes-Gómez, J. D., Toloza-Ruíz, C. J., & Durán-Moreno, A. A. (2023). Machine and deep learning algorithms for early dropout prediction in higher education: A systematic review. EAI Endorsed Transactions on Scalable Information Systems, 10(2), e6. https://doi.org/10.4108/eetsis.3586.

Bhatt, C., Sajja, P. S., & Liyanage, S. (Eds.). (2020). Utilizing educational data mining techniques for improved learning: Emerging research and opportunities. IGI Global. https://doi.org/10.4018/978-1-7998-0010-1.

Bouckaert, R. R., Frank, E., Hall, M., Kirkby, R., Reutemann, P., Seewald, A., & Scuse, D. (2018, September 4). WEKA manual for version 3-8-3. University of Waikato. https://user.eng.umd.edu/~austin/ence688p.d/handouts/WekaManual2018.pdf.

Cedillo Arce, J. M., Beltrán Abreo, H. M., Saltos Arce, M. I., & Soriano Barzola, F. R. (2024). Explorando la minería de datos en la gestión educativa superior: desafíos y oportunidades en la era digital. Reincisol, 3(5), 1368–1385. https://doi.org/10.59282/reincisol.V3(5)1367-1385.

Cerón Garnica, C., Moyao Martínez, Y., Martínez Guzmán, G., y Mila Avendaño, V. M. (2025). Análisis de los Recursos Educativos Abiertos en el rezago de aprendizajes en el bachillerato postpandemia. EDUCATECIENCIA, 33(2), 1-33. https://educateconciencia.com/index.php/revistaeducate/article/view/380

Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., & Witten, I. H. (2019). WEKA 3.8.6 [Software]. Universidad de Waikato. https://www.cs.waikato.ac.nz/ml/weka/.

Han, J., Kamber, M., & Pei, J. (2012). Data mining: Concepts and techniques (3rd ed.). Morgan Kaufmann. https://doi.org/10.1016/C2009-0-61819-5.

Information Resources Management Association. (2018). Information Retrieval and Management: Concepts, Methodologies, Tools, and Applications (4 vols.). IGI Global. https://doi.org/10.4018/978-1-5225-5191-1.

Lampropoulos, G. (2023). Educational data mining and learning analytics in the 21st century. En Encyclopedia of data science and machine learning (pp. 1642–1651). IGI Global. https://doi.org/10.4018/978-1-7998-9220-5.ch098.

Ordoñez-Avila, R., Salgado Reyes, N., Meza, J., & Ventura, S. (2023). Data mining techniques for predicting teacher evaluation in higher education: A systematic literature review. Heliyon, 9(3), e13939. https://doi.org/10.1016/j.heliyon.2023.e13939.

Romero, C., & Ventura, S. (2024). Educational data mining and learning analytics: An updated survey. Journal of Educational Data Mining. https://doi.org/10.1002/widm.1355.

University of Waikato. (s. f.). https://www.cs.waikato.ac.nz/ml/weka/.

Witten, I. H., Frank, E., & Hall, M. A. (2011). Data Mining: Practical Machine Learning Tools and Techniques (3rd ed.). Morgan Kaufmann. https://dl.acm.org/doi/book/10.5555/1972514.

Cespedes Morai, J. M., & Oliver Chag, A. (2023). El Impacto de la Educación Virtual en el Rendimiento Académico: Un Estudio Longitudinal en Estudiantes de Ciencias Sociales. Ciencia Y Reflexión, 2(1), 14–28. https://doi.org/10.70747/cr.v2i1.15

Urquidez Romero , R., Avitia Sánchez, A., Cano Ramírez , D., Jiménez Montes , L. V., Barranco Merino, G. I., & Reyes Ruvalcaba, D. (2025). Programa de Intervención con un Suplemento Multivitamínico para Mejorar el Estado de Nutrición y Anemia en Niños en Condición de Vulnerabilidad Social de Ciudad Juárez Chihuahua. Ciencia Latina Revista Científica Multidisciplinar, 9(3), 8340-8354. https://doi.org/10.37811/cl_rcm.v9i3.18460

Jiménez Rodríguez, J. M. (2024). Euthanasia In Spain: An Interpretive Analysis Of The Current Regulations From The Health Social Work. Ciencia Y Reflexión, 3(2), 1–20. https://doi.org/10.70747/cr.v3i2.4

Tenesaca Canchignia , D. C., Canchignia Bonilla, E. L., Remache Guamán, N. V., Guamán Sagñay , H. P., & Hualcopo Duchicela, U. E. (2025). Guía para padres con respecto al uso de dispositivos móviles el niños de nivel preparatorio. Arandu UTIC, 12(2), 287–307. https://doi.org/10.69639/arandu.v12i2.925

Araujo García, D., Chang Espinosa , O. Y., & Pérez Vázquez , D. (2025). Consultoría Estratégica para Mipymes: Estudio de Mercado para Impulsar el Desarrollo Regional en Perote, Veracruz. Estudios Y Perspectivas Revista Científica Y Académica , 5(3), 27–45. https://doi.org/10.61384/r.c.a.v5i3.1328

Simbaña Cabrera, H. A., Haro Jácome, O. F., García-Romero , C. A., & Analuisa García , P. S. (2025). La titulación rural, una propuesta colectiva que evidencia la realidad educativa de las escuelas multigrado. Emergentes - Revista Científica, 5(2), 1–14. https://doi.org/10.60112/erc.v5.i2.385

Cortés Viveros, N., Hernández García, R. A., Galván Sarabia, A., Olivares Galvan, H. R., & Texon Olguin, O. A. (2025). En Busca del Modelo Ideal para Determinar las Variables que Explican el Tiempo de Desempleo en Buscadores Xalapeños. Estudios Y Perspectivas Revista Científica Y Académica , 5(3), 65–81. https://doi.org/10.61384/r.c.a.v5i3.1332

Bernal Parraga, A. P., Salazar Véliz , E. T., Zambrano Lamilla, L. M., Espinoza Jaramillo , S. G., Morales García , C. S., Shinger Hipatia, N. S., & Zapata Calderón , S. J. (2025). Innovaciones Didácticas para Lengua y Literatura Basadas en el Aprendizaje Personalizado y Colaborativo . Revista Científica De Salud Y Desarrollo Humano , 6(2), 01–32. https://doi.org/10.61368/r.s.d.h.v6i2.574

Sabando Suárez, A. A., Vega Guamangate, J. M., García Gallirgos, V. J., & Mora Carpio, W. T. (2025). Impacto del Gasto Social en el Índice de Desarrollo Humano en Ecuador. periodo 2001-2023. Revista Veritas De Difusão Científica, 6(2), 1593–1633. https://doi.org/10.61616/rvdc.v6i2.707

Publicado
2025-12-11
Cómo citar
Moyao Martínez , Y. (2025). Minería de datos educativa con Weka: aplicaciones y modelado predictivo. Ciencia Latina Revista Científica Multidisciplinar, 9(5), 16853-16865. https://doi.org/10.37811/cl_rcm.v9i5.21172
Sección
Ciencias y Tecnologías