Predição precoce de problemas de desempenho de estudantes em modalidade de educação on-line: um estudo de caso no ensino médio integrado

João Paulo Lopes de Souza; Janderson Ferreira Dutra; Damires Yluska de Souza Fernandes

doi:10.18265/1517-0306a2021id5182

Autores

João Paulo Lopes de Souza Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) Brazil
Janderson Ferreira Dutra Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) Brazil http://orcid.org/0000-0003-4601-1461
Damires Yluska de Souza Fernandes Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB) Brazil

DOI:

https://doi.org/10.18265/1517-0306a2021id5182

Palavras-chave:

aprendizado de máquina, classificação supervisionada, educação on-line, mineração de dados educacionais, predição de desempenho de estudantes

Resumo

A necessidade de acompanhamento dos estágios de aprendizado discente e suas dificuldades de forma precoce tomou uma dimensão ainda maior nesses tempos recentes de pandemia de COVID-19 e de ensino on-line. Nesse panorama, este trabalho apresenta uma abordagem para predizer, de forma precoce, o desempenho de estudantes com probabilidade de reprovação superior a 50% em disciplinas específicas que ocorrem em ensino on-line. Para analisar e avaliar a viabilidade da abordagem proposta foi realizado um estudo de caso com dados do ensino técnico integrado do Campus Monteiro do IFPB a partir de dois cenários: (i) para turmas do primeiro ano e (ii) para turmas do segundo e terceiro anos. Foi construído um conjunto de dados com dados reais originados do Google Sala de Aula e do SUAP. Com base no conjunto de dados criado, foram construídos e avaliados modelos de classificação supervisionada usando os métodos Naive Bayes, KNN (K Nearest Neighbors), SVM (Support Vector Machine), Random Forest, Gradient Boosting e Extreme Gradient Boosting. Os métodos de classificação SVM e Gradient Boosting obtiveram especificidade superiores a 93% e 80%, respectivamente.

Downloads

Não há dados estatísticos.

Métricas

Carregando Métricas ...

Referências

ALBON, C. Machine Learning with Python cookbook: practical solutions from preprocessing to Deep Learning. 1. ed. Sebastopol: O’Reilly Media, 2018.

BARROS, R. P.; SANTANA JUNIOR, O. V.; SILVA, I. R. M.; SANTOS, L. F.; CÂMARA NETO, V. R. Predição do rendimento dos alunos em lógica de programação com base no desempenho das disciplinas do primeiro período do curso de ciências e tecnologia utilizando técnicas de mineração de dados. Brazilian Journal of Development, v. 6, n. 1, p. 2523-2534, 16 jan. 2020. DOI: https://doi.org/10.34117/bjdv6n1-186.

BREIMAN, L. Random forests. Machine Learning, v. 45, n. 1, p. 5-32, 2001. DOI: https://doi.org/10.1023/A:1010933404324.

CANO, A.; LEONARD, J. D. Interpretable Multiview Early Warning System Adapted to Underrepresented Student Populations. IEEE Transactions on Learning Technologies, v. 12, n. 2, p. 198-211, 1 abr. 2019. DOI: https://doi.org/10.1109/TLT.2019.2911079.

CHANLEKHA, H.; NIRAMITRANON, J. Student performance prediction model for early-identification of at-risk students in traditional classroom settings. In: INTERNATIONAL CONFERENCE ON MANAGEMENT OF DIGITAL ECOSYSTEMS, 10., 2018, Tokyo. Proceedings (...). New York: Association for Computing Machinery, 2018. DOI: https://doi.org/10.1145/3281375.3281403.

CHAPMAN, P.; CLINTON, J.; KERBER, R.; KHABAZA, T.; REINARTZ, T.P.; SHEARER, C.; WIRTH, R. CRISP-DM 1.0: step-by-step data mining guide. [S.l.]: CRISP-DM Consortium, 2000. Disponível em: https://www.kde.cs.uni-kassel.de/wp-content/uploads/lehre/ws2012-13/kdd/files/CRISPWP-0800.pdf. Acesso em: 30 jan. 2021.

CHEN, T.; GUESTRIN, C. XGBoost: A Scalable Tree Boosting System. In: ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING, 22., 2016, San Francisco. Proceedings (...). New York: ACM, 2016. DOI: https://doi.org/10.1145/2939672.2939785.

CORTES, C.; VAPNIK, V. Support-vector networks. Machine Learning, v. 20, n. 3, p. 273-297, set. 1995. DOI: https://doi.org/10.1007/BF00994018.

FERRARI, D.; CASTRO, L. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. 1. ed. São Paulo: Saraiva, 2016.

FRIEDMAN, J. H. Greedy function approximation: A gradient boosting machine. The Annals of Statistics, v. 29, n. 5, p. 1189-1232, 2001. DOI: https://doi.org/10.1214/aos/1013203451.

GUO, G.;WANG, H.; BELL, D.; BI, Y.; GREER, K. KNN model-based approach in classification. In: MEERSMAN, R.; TARI, Z.; SCHMIDT, D. C. (ed.). On The Move to Meaningful Internet Systems 2003: CoopIS, DOA, and ODBASE. OTM 2003. Berlin: Springer, 2003. (Lecture Notes in Computer Science, v. 2888). DOI: https://doi.org/10.1007/978-3-540-39964-3_62.

HARRINGTON, P. Machine Learning in action. Shelter Island: Manning Publications, 2012.

HE, H.; MA, Y. Imbalanced learning: foundations, algorithms, and applications. IEEE. New Jersey: John Wiley & Sons, 2013.

JOHN, G. H.; LANGLEY, P. Estimating continuous distributions in bayesian classifiers. arXiv preprint, arXiv:1302.4964, 2013. DOI: https://doi.org/10.48550/arXiv.1302.4964.

MANISH, P. Handling categorical data in Python tutorial. Datacamp, 5 jan. 2020. Disponível em: https://www.datacamp.com/community/tutorials/categorical-data. Acesso em: 30 jan. 2021.

MOHAN, A. Cross-validation for imbalanced datasets. Lumiata, 5 mar. 2019. Disponível em: https://medium.com/lumiata/cross-validation-for-imbalanced-datasets-9d203ba47e8. Acesso em: 12 dez. 2020.

PIMENTEL, M.; ARAUJO, R. #FiqueEmCasa, mas se mantenha ensinando-aprendendo: algumas questões educacionais em tempos de pandemia. SBC Horizontes, 30 mar. 2020. Disponível em: http://horizontes.sbc.org.br/index.php/2020/03/fiqueemcasa/. Acesso em: 3 set. 2020.

RABELO, H.; BURLAMAQUI, A.; VALENTIM, R.; RABELO, D. S. S.; MEDEIROS, S. Utilização de técnicas de mineração de dados educacionais para predição de desempenho de alunos de EaD em ambientes virtuais de aprendizagem. Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação - SBIE), Anais do SBIE 2017 (Proceedings of the SBIE 2017), p. 1527-1536, out. 2017. DOI: http://dx.doi.org/10.5753/cbie.sbie.2017.1527.

ROMERO, C.; VENTURA, S. Educational data mining and learning analytics: an updated survey. WIREs Data Mining and Knowledge Discovery, v. 10, n. 3, e1355, 2020. DOI: https://doi.org/10.1002/widm.1355.

RONALDO, G.; PASSOS, E.; BEZERRA, E. Data Mining: conceitos, técnicas, algoritmos, orientações e aplicações. 2. ed. Rio de Janeiro: Elsevier, 2015.

SANTOS, E. Educação online para além da EAD: um fenômeno da cibercultura. In: CONGRESSO INTERNACIONAL GALEGO-PORTUGUÊS DE PSICOPEDAGOGIA, 10., 2009, Braga, Portugal. Actas (...). Braga: Universidade do Minho, 2009. p. 5658-5671. Disponível em: https://www.educacion.udc.es/grupos/gipdae/documentos/congreso/xcongreso/pdfs/t12/t12c427.pdf. Acesso em: 11 dez. 2020.

SANTOS, M. S.; SOARES, J. P.; ABREU, P. H.; ARAUJO, H.; SANTOS, J. Cross-validation for imbalanced datasets: avoiding overoptimistic and overfitting approaches [Research Frontier]. IEEE Computational Intelligence Magazine, v. 13, n. 4, p. 59-76, 1 nov. 2018. DOI: https://doi.org/10.1109/MCI.2018.2866730.

Predição precoce de problemas de desempenho de estudantes em modalidade de educação on-line: um estudo de caso no ensino médio integrado

Autores

DOI:

Palavras-chave:

Resumo

Downloads

Métricas

Referências

Downloads

Publicado

Como Citar

Edição

Seção

Licença

Artigos mais lidos pelo mesmo(s) autor(es)

Google Tradutor

Enviar Submissão

info_basica

Qualis CAPES

Informações

Redes Sociais

Associada/membro/apoiador

Bases de Dados Indexadas

Preservação Digital

Mapa

Palavras-chave