Predição precoce de problemas de desempenho de estudantes em modalidade de educação on-line: um estudo de caso no ensino médio integrado

João Paulo Lopes de Souza

Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) Brasil

Janderson Ferreira Dutra

ORCID iD Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) Brasil

Damires Yluska de Souza Fernandes

Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) Brasil

Resumo

A necessidade de acompanhamento dos estágios de aprendizado discente e suas dificuldades de forma precoce tomou uma dimensão ainda maior nesses tempos recentes de pandemia de COVID-19 e de ensino on-line. Nesse panorama, este trabalho apresenta uma abordagem para predizer, de forma precoce, o desempenho de estudantes com probabilidade de reprovação superior a 50% em disciplinas específicas que ocorrem em ensino on-line. Para analisar e avaliar a viabilidade da abordagem proposta foi realizado um estudo de caso com dados do ensino técnico integrado do Campus Monteiro do IFPB a partir de dois cenários: (i) para turmas do primeiro ano e (ii) para turmas do segundo e terceiro anos. Foi construído um conjunto de dados com dados reais originados do Google Sala de Aula e do SUAP. Com base no conjunto de dados criado, foram construídos e avaliados modelos de classificação supervisionada usando os métodos Naive Bayes, KNN (K Nearest Neighbors), SVM (Support Vector Machine), Random Forest, Gradient Boosting e Extreme Gradient Boosting. Os métodos de classificação SVM e Gradient Boosting obtiveram especificidade superiores a 93% e 80%, respectivamente.

Palavras-chave


aprendizado de máquina; classificação supervisionada; educação on-line; mineração de dados educacionais; predição de desempenho de estudantes


Texto completo:

Referências


ALBON, C. Machine Learning with Python cookbook: practical solutions from preprocessing to Deep Learning. 1. ed. Sebastopol: O’Reilly Media, 2018.

BARROS, R. P.; SANTANA JUNIOR, O. V.; SILVA, I. R. M.; SANTOS, L. F.; CÂMARA NETO, V. R. Predição do rendimento dos alunos em lógica de programação com base no desempenho das disciplinas do primeiro período do curso de ciências e tecnologia utilizando técnicas de mineração de dados. Brazilian Journal of Development, v. 6, n. 1, p. 2523-2534, 16 jan. 2020. DOI: https://doi.org/10.34117/bjdv6n1-186.

BREIMAN, L. Random forests. Machine Learning, v. 45, n. 1, p. 5-32, 2001. DOI: https://doi.org/10.1023/A:1010933404324.

CANO, A.; LEONARD, J. D. Interpretable Multiview Early Warning System Adapted to Underrepresented Student Populations. IEEE Transactions on Learning Technologies, v. 12, n. 2, p. 198-211, 1 abr. 2019. DOI: https://doi.org/10.1109/TLT.2019.2911079.

CHANLEKHA, H.; NIRAMITRANON, J. Student performance prediction model for early-identification of at-risk students in traditional classroom settings. In: INTERNATIONAL CONFERENCE ON MANAGEMENT OF DIGITAL ECOSYSTEMS, 10., 2018, Tokyo. Proceedings (...). New York: Association for Computing Machinery, 2018. DOI: https://doi.org/10.1145/3281375.3281403.

CHAPMAN, P.; CLINTON, J.; KERBER, R.; KHABAZA, T.; REINARTZ, T.P.; SHEARER, C.; WIRTH, R. CRISP-DM 1.0: step-by-step data mining guide. [S.l.]: CRISP-DM Consortium, 2000. Disponível em: https://www.kde.cs.uni-kassel.de/wp-content/uploads/lehre/ws2012-13/kdd/files/CRISPWP-0800.pdf. Acesso em: 30 jan. 2021.

CHEN, T.; GUESTRIN, C. XGBoost: A Scalable Tree Boosting System. In: ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING, 22., 2016, San Francisco. Proceedings (...). New York: ACM, 2016. DOI: https://doi.org/10.1145/2939672.2939785.

CORTES, C.; VAPNIK, V. Support-vector networks. Machine Learning, v. 20, n. 3, p. 273-297, set. 1995. DOI: https://doi.org/10.1007/BF00994018.

FERRARI, D.; CASTRO, L. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. 1. ed. São Paulo: Saraiva, 2016.

FRIEDMAN, J. H. Greedy function approximation: A gradient boosting machine. The Annals of Statistics, v. 29, n. 5, p. 1189-1232, 2001. DOI: https://doi.org/10.1214/aos/1013203451.

GUO, G.;WANG, H.; BELL, D.; BI, Y.; GREER, K. KNN model-based approach in classification. In: MEERSMAN, R.; TARI, Z.; SCHMIDT, D. C. (ed.). On The Move to Meaningful Internet Systems 2003: CoopIS, DOA, and ODBASE. OTM 2003. Berlin: Springer, 2003. (Lecture Notes in Computer Science, v. 2888). DOI: https://doi.org/10.1007/978-3-540-39964-3_62.

HARRINGTON, P. Machine Learning in action. Shelter Island: Manning Publications, 2012.

HE, H.; MA, Y. Imbalanced learning: foundations, algorithms, and applications. IEEE. New Jersey: John Wiley & Sons, 2013.

JOHN, G. H.; LANGLEY, P. Estimating continuous distributions in bayesian classifiers. arXiv preprint, arXiv:1302.4964, 2013. DOI: https://doi.org/10.48550/arXiv.1302.4964.

MANISH, P. Handling categorical data in Python tutorial. Datacamp, 5 jan. 2020. Disponível em: https://www.datacamp.com/community/tutorials/categorical-data. Acesso em: 30 jan. 2021.

MOHAN, A. Cross-validation for imbalanced datasets. Lumiata, 5 mar. 2019. Disponível em: https://medium.com/lumiata/cross-validation-for-imbalanced-datasets-9d203ba47e8. Acesso em: 12 dez. 2020.

PIMENTEL, M.; ARAUJO, R. #FiqueEmCasa, mas se mantenha ensinando-aprendendo: algumas questões educacionais em tempos de pandemia. SBC Horizontes, 30 mar. 2020. Disponível em: http://horizontes.sbc.org.br/index.php/2020/03/fiqueemcasa/. Acesso em: 3 set. 2020.

RABELO, H.; BURLAMAQUI, A.; VALENTIM, R.; RABELO, D. S. S.; MEDEIROS, S. Utilização de técnicas de mineração de dados educacionais para predição de desempenho de alunos de EaD em ambientes virtuais de aprendizagem. Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação - SBIE), Anais do SBIE 2017 (Proceedings of the SBIE 2017), p. 1527-1536, out. 2017. DOI: http://dx.doi.org/10.5753/cbie.sbie.2017.1527.

ROMERO, C.; VENTURA, S. Educational data mining and learning analytics: an updated survey. WIREs Data Mining and Knowledge Discovery, v. 10, n. 3, e1355, 2020. DOI: https://doi.org/10.1002/widm.1355.

RONALDO, G.; PASSOS, E.; BEZERRA, E. Data Mining: conceitos, técnicas, algoritmos, orientações e aplicações. 2. ed. Rio de Janeiro: Elsevier, 2015.

SANTOS, E. Educação online para além da EAD: um fenômeno da cibercultura. In: CONGRESSO INTERNACIONAL GALEGO-PORTUGUÊS DE PSICOPEDAGOGIA, 10., 2009, Braga, Portugal. Actas (...). Braga: Universidade do Minho, 2009. p. 5658-5671. Disponível em: https://www.educacion.udc.es/grupos/gipdae/documentos/congreso/xcongreso/pdfs/t12/t12c427.pdf. Acesso em: 11 dez. 2020.

SANTOS, M. S.; SOARES, J. P.; ABREU, P. H.; ARAUJO, H.; SANTOS, J. Cross-validation for imbalanced datasets: avoiding overoptimistic and overfitting approaches [Research Frontier]. IEEE Computational Intelligence Magazine, v. 13, n. 4, p. 59-76, 1 nov. 2018. DOI: https://doi.org/10.1109/MCI.2018.2866730.


DOI: http://dx.doi.org/10.18265/1517-0306a2021id5182

O arquivo PDF selecionado deve ser carregado no navegador caso tenha instalado um plugin de leitura de arquivos PDF (por exemplo, uma versão atual do Adobe Acrobat Reader).

Como alternativa, pode-se baixar o arquivo PDF para o computador, de onde poderá abrí-lo com o leitor PDF de sua preferência. Para baixar o PDF, clique no link abaixo.

Caso deseje mais informações sobre como imprimir, salvar e trabalhar com PDFs, a Highwire Press oferece uma página de Perguntas Frequentes sobre PDFs bastante útil.

Visitas a este artigo: 1253

Total de downloads do artigo: 744