Extraction Student Dropout Patterns with Data Mining Techniques in Undergraduate Programs

Ricardo Timarán Pereira, Andrés Calderón Romero, Javier Jiménez Toledo

Abstract

The first results of the research project that aims to identify patterns of student dropout from socioeconomic, academic, disciplinary and institutional data of students from undergraduate programs at the University of Nariño from Pasto city (Colombia), using data mining techniques are presented. Built a data repository with the records of students who were admitted in the period from the first half of 2004 and the second semester of 2006. Three complete cohorts were analyzed with an observation period of six years until 2011. Socioeconomic and academic student dropout profiles were discovered using classification technique based on decision trees. The knowledge generated will support effective decision-making of university staff focused to develop policies and strategies related to student retention programs that are currently set.

References

  1. Adamo, J. M., 2001. Data Mining for Association Rules and Sequential Patterns: Sequential and Parallel Algorithms. New York (USA): Springer-Verlag. 253 p. ISBN: 0-387-95048-6.
  2. Agrawal, R., Srikant, R., 1994. Fast Algorithms for Mining Association Rules. In: 20th International Conference on Very Large Data Bases, VLDB 1994, (12-15/09/1994). Santiago de Chile (Chile): VLDB.Proceedings. p. 487-499. ISBN: 1-55860-153-8.
  3. Agrawal, R., Srikant, R., 1995. Mining Sequential Patterns. In: The 11th International Conference on Data Engineering ICDE, pp 3-14. Taipei, Taiwan.
  4. Chen, M., Han, J., Yu, P., 1996. Data mining: An overview from database perspective. In: IEEE Transactions on Knowledge and Data Engineering. Vol. 8, No. 6 (dic). Los Alamitos (CA, USA): IEEE Computer Society. p. 866-883. ISSN: 1041-4347.
  5. Fayyad, Usama, Piatetsky-Shapiro, Gregory, Smyth, Padrahic, 1996. The KDD process for extracting useful knowledge from volumes of data. In: Comunications of the ACM. Vol 39, No. 11 (nov). New York (USA): ACM Digital Library. p 27-34. ISSN: 0001-0782.
  6. Garcia Morate, Diego (s.f.). Manual de Weka (on líne), http://www.metaemotion.com/diego.garcia.morate/do wnload/weka.pdf (consulta: 15/06/ 2012).
  7. Han, Jiawei, Kamber, Micheline, 2001. Data Mining: Concepts and Techniques. San Francisco (CA, USA): Morgan Kaufmann Publishers, Academic Press. 550 p. ISBN: 1-55860-489-8.
  8. Hernández, O. J., Ramírez, Q. M., Ferri, R. C., 2005. Introducción a la Minería de Datos. Madrid (España): Pearson Prentice Hall. 656 p. ISBN: 84-205-4091-9.
  9. Hernández, E., Lorente, R., 2009. Minería de datos aplicada a la detección de Cáncer de Mama. Universidad Carlos III, Madrid. http://www.it.uc3m.es/jvillena/irc/practicas/08-9/14.pdf.
  10. La Red, David, Acosta, J. C., Cutro, Luis, Uribe, V. E., Rambo, A. R., 2010. Data Warehouse y Data Mining Aplicados al Estudio del Rendimiento Académico. In: Novena Conferencia Iberoamericana en Sistemas, Cibernética e Informática, CISCI 2010, (29/06- 2/07/2010), Orlando (Florida, USA): International Institute of Informatics and Systemics. Memorias CISCI 2010, Volumen I, p. 289-294. ISBN: 978-1-934272-94-7.
  11. MEN, 2006a. América Latina piensa la deserción. En: Boletín informativo Educación Superior. No 7 (dic). Bogotá (Colombia): Ministerio de Educación Nacional. p 14. ISSN: 1794-2446.
  12. MEN, 2006b. Deserción estudiantil: prioridad en la agenda. En: Boletín informativo Educación Superior. No 7 (dic). Bogotá (Colombia): Ministerio de Educación Nacional. p 1. ISSN: 1794-2446.
  13. MEN, 2009. Deserción estudiantil en la educación superior colombiana: metodología de seguimiento, diagnóstico y elementos para su prevención. Bogotá (Colombia): Ministerio de Educación Nacional. 158 p. ISBN: 978-958-691-366-9.
  14. OCARA, 2011. Datos de estudiantes matriculados en los programas de pregrado de la Universidad de Nariño en el periodo A de 2004 hasta el periodo A de 2011. Oficina de Control y Registro Académico de la Universidad de Nariño. Pasto (Colombia).
  15. Pautsch, Jesús, 2009. Minería de datos aplicada al análisis de la deserción en la Carrera de Analista en Sistemas de Computación. Tesis de grado (Licenciado en Sistemas de Información). Posadas, Misiones (Argentina): Universidad Nacional de Misiones. 193 p.
  16. Pautsch, Jesús, La Red, David, Cutro, Luis, 2010. Minería de datos aplicada al análisis de la deserción en la Carrera de Analista en Sistemas de Computación (on líne). Posadas, Misiones (Argentina): Universidad Nacional de Misiones. http://www.dataprix.com/files/Analisis%20de%20Des ercion%20Univ_0.pdf. (consulta: 18/06/2012).
  17. Pinzón, Liza, 2011. Aplicando minería de datos al marketing educativo. In: Revista Notas de Marketing. No 1 (jun). Bogotá (Colombia): Universidad Sergio Arboleda, Escuela de Marketing y Publicidad. p 45-61.
  18. Quinlan, J. R., 1986. Induction of Decision Trees. In: Machine Learning Journal, Vol. 1, No. 1, Kluwer Academic Publishers, pp. 81-106. Boston, USA.
  19. Quinlan, J. R., 1993. C4.5: Programs for Machine Learning. San Francisco (CA, USA): Morgan Kaufmann Publishers. 299 p. ISBN: 1-55860-238-0.
  20. Restrepo, Mauricio, López, Andrés, 2008. Uso de la metodología Rough Sets en un modelo de deserción académica. In: XIV Congreso Ibero Latinoamericano de Investigación de Operaciones, CLAIO 2008, (9- 12/09/2008), Cartagena (Colombia). Universidad del Norte. Libro de Memorias CLAIO 2008, p.108-109. Ediciones Uninorte.
  21. Sattler, K., Dunemann, O., 2001. SQL Database Primitives for Decision Tree Classifiers. In: The 10th ACM International Conference on Information and Knowledge Management - CIKM, (5-10/11/2001), Atlanta, Georgia (USA): ACM. Proceedings, p. 379- 386. ISBN: 1-58113-436-3.
  22. Spositto, Osvaldo, Etcheverry, Martín, Ryckeboer, Hugo, Bossero, Julio, 2010. Aplicación de técnicas de minería de datos para la evaluación del rendimiento académico y la deserción estudiantil. In: Novena Conferencia Iberoamericana en Sistemas, Cibernética e Informática, CISCI 2010, (29/06-2/07/2010), Orlando (Florida, EE.UU.). International Institute of Informatics and Systemics. Memorias CISCI 2010, Volumen I. ISBN: 978-1-934272-94-7.
  23. Timarán, R., Millán, M., 2006. New Algebraic Operators and SQL Primitives for Mining Classification Rules. In: proceedings of The Five IASTED International Conference on Computational Intelligence (CI 2006), International Association of Science and Technology for Development, ISBN No 0-88986-603-1. San Francisco, USA.
  24. Timarán Pereira, Ricardo, 2009. Una mirada al descubrimiento de conocimiento en bases de datos. In: Ventana Informática. No 20 (ene-jun., 2009). Manizales (Colombia): Centro de Investigaciones, Desarrollo e Innovación, Facultad de Ingeniería, Universidad de Manizales. p 39-58. ISSN: 0123- 9678.
  25. UPN, 2005. La deserción estudiantil: reto investigativo y estratégico asumido de forma integral por la UPN (on line). In: Encuentro Internacional sobre Deserción en Educación Superior: experiencias significativas (17- 18/05/2005) Bogotá (Colombia): Ministerio de Educación Nacional. http://www.mineducacion. gov.co/1621/ articles-85600_Archivo_pdf3.pdf. (consulta: 15/06/ 2012).
  26. Valero, Sergio, 2009. Aplicación de técnicas de minería de datos para predecir la deserción (on línea). Izúcar de Matamoros, Puebla (Mexico): Universidad Tecnológica de Izúcar de Matamoros. http://www.utim.edu.mx/svalero/docs/MineriaDeserc ion.pdf. (consulta: 10/06/2012).
  27. Valero, Sergio, Salvador, Alejandro, García, Marcela, 2010. Minería de datos: predicción de la deserción escolar mediante el algoritmo de árboles de decisión y el algoritmo de los k vecinos más cercanos (on line) Izúcar de Matamoros, Puebla (Mexico): Universidad Tecnológica de Izúcar de Matamoros. http:// www.utim.edu.mx/svalero/docs/e1.pdf. (consulta: 10/06/2012).
  28. Wang, M.; Iyer, B., Scott, V., J., 1998. Scalable Mining for Classification Rules in Relational Databases. In: International Database Engineering and Application Symposium, IDEAS 98, (08-10/07/1998), Cardiff (Wales,U.K.): IEEE Computer Society. Proceedings, p. 58-67. ISBN: 0-8186-8307-4.
  29. Witten, I. and Frank, E., 2000. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann Publishers, 365 p, ISBN: 1-55860-552-5. San Francisco, CA, USA.
  30. Zhang, T., Ramakrishnan, R., Livny, M., 1996. BIRCH: An Efficient Data Clustering Method for Very Large Databases. In ACM SIGMOD International Conference on Management of Data, pp. 103-114. Montreal, Canada.
Download


Paper Citation


in Harvard Style

Timarán Pereira R., Calderón Romero A. and Jiménez Toledo J. (2013). Extraction Student Dropout Patterns with Data Mining Techniques in Undergraduate Programs . In Proceedings of the International Conference on Knowledge Discovery and Information Retrieval and the International Conference on Knowledge Management and Information Sharing - Volume 1: KDIR, (IC3K 2013) ISBN 978-989-8565-75-4, pages 136-142. DOI: 10.5220/0004543001360142


in Bibtex Style

@conference{kdir13,
author={Ricardo Timarán Pereira and Andrés Calderón Romero and Javier Jiménez Toledo},
title={Extraction Student Dropout Patterns with Data Mining Techniques in Undergraduate Programs},
booktitle={Proceedings of the International Conference on Knowledge Discovery and Information Retrieval and the International Conference on Knowledge Management and Information Sharing - Volume 1: KDIR, (IC3K 2013)},
year={2013},
pages={136-142},
publisher={SciTePress},
organization={INSTICC},
doi={10.5220/0004543001360142},
isbn={978-989-8565-75-4},
}


in EndNote Style

TY - CONF
JO - Proceedings of the International Conference on Knowledge Discovery and Information Retrieval and the International Conference on Knowledge Management and Information Sharing - Volume 1: KDIR, (IC3K 2013)
TI - Extraction Student Dropout Patterns with Data Mining Techniques in Undergraduate Programs
SN - 978-989-8565-75-4
AU - Timarán Pereira R.
AU - Calderón Romero A.
AU - Jiménez Toledo J.
PY - 2013
SP - 136
EP - 142
DO - 10.5220/0004543001360142