Predição precoce de problemas de desempenho de estudantes em modalidade de educação on-line: um estudo de caso no ensino médio integrado
DOI:
https://doi.org/10.18265/1517-0306a2021id5182Palavras-chave:
aprendizado de máquina, classificação supervisionada, educação on-line, mineração de dados educacionais, predição de desempenho de estudantesResumo
A necessidade de acompanhamento dos estágios de aprendizado discente e suas dificuldades de forma precoce tomou uma dimensão ainda maior nesses tempos recentes de pandemia de COVID-19 e de ensino on-line. Nesse panorama, este trabalho apresenta uma abordagem para predizer, de forma precoce, o desempenho de estudantes com probabilidade de reprovação superior a 50% em disciplinas específicas que ocorrem em ensino on-line. Para analisar e avaliar a viabilidade da abordagem proposta foi realizado um estudo de caso com dados do ensino técnico integrado do Campus Monteiro do IFPB a partir de dois cenários: (i) para turmas do primeiro ano e (ii) para turmas do segundo e terceiro anos. Foi construído um conjunto de dados com dados reais originados do Google Sala de Aula e do SUAP. Com base no conjunto de dados criado, foram construídos e avaliados modelos de classificação supervisionada usando os métodos Naive Bayes, KNN (K Nearest Neighbors), SVM (Support Vector Machine), Random Forest, Gradient Boosting e Extreme Gradient Boosting. Os métodos de classificação SVM e Gradient Boosting obtiveram especificidade superiores a 93% e 80%, respectivamente.
Downloads
Referências
ALBON, C. Machine Learning with Python cookbook: practical solutions from preprocessing to Deep Learning. 1. ed. Sebastopol: O’Reilly Media, 2018.
BARROS, R. P.; SANTANA JUNIOR, O. V.; SILVA, I. R. M.; SANTOS, L. F.; CÂMARA NETO, V. R. Predição do rendimento dos alunos em lógica de programação com base no desempenho das disciplinas do primeiro período do curso de ciências e tecnologia utilizando técnicas de mineração de dados. Brazilian Journal of Development, v. 6, n. 1, p. 2523-2534, 16 jan. 2020. DOI: https://doi.org/10.34117/bjdv6n1-186.
BREIMAN, L. Random forests. Machine Learning, v. 45, n. 1, p. 5-32, 2001. DOI: https://doi.org/10.1023/A:1010933404324.
CANO, A.; LEONARD, J. D. Interpretable Multiview Early Warning System Adapted to Underrepresented Student Populations. IEEE Transactions on Learning Technologies, v. 12, n. 2, p. 198-211, 1 abr. 2019. DOI: https://doi.org/10.1109/TLT.2019.2911079.
CHANLEKHA, H.; NIRAMITRANON, J. Student performance prediction model for early-identification of at-risk students in traditional classroom settings. In: INTERNATIONAL CONFERENCE ON MANAGEMENT OF DIGITAL ECOSYSTEMS, 10., 2018, Tokyo. Proceedings (...). New York: Association for Computing Machinery, 2018. DOI: https://doi.org/10.1145/3281375.3281403.
CHAPMAN, P.; CLINTON, J.; KERBER, R.; KHABAZA, T.; REINARTZ, T.P.; SHEARER, C.; WIRTH, R. CRISP-DM 1.0: step-by-step data mining guide. [S.l.]: CRISP-DM Consortium, 2000. Disponível em: https://www.kde.cs.uni-kassel.de/wp-content/uploads/lehre/ws2012-13/kdd/files/CRISPWP-0800.pdf. Acesso em: 30 jan. 2021.
CHEN, T.; GUESTRIN, C. XGBoost: A Scalable Tree Boosting System. In: ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING, 22., 2016, San Francisco. Proceedings (...). New York: ACM, 2016. DOI: https://doi.org/10.1145/2939672.2939785.
CORTES, C.; VAPNIK, V. Support-vector networks. Machine Learning, v. 20, n. 3, p. 273-297, set. 1995. DOI: https://doi.org/10.1007/BF00994018.
FERRARI, D.; CASTRO, L. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. 1. ed. São Paulo: Saraiva, 2016.
FRIEDMAN, J. H. Greedy function approximation: A gradient boosting machine. The Annals of Statistics, v. 29, n. 5, p. 1189-1232, 2001. DOI: https://doi.org/10.1214/aos/1013203451.
GUO, G.;WANG, H.; BELL, D.; BI, Y.; GREER, K. KNN model-based approach in classification. In: MEERSMAN, R.; TARI, Z.; SCHMIDT, D. C. (ed.). On The Move to Meaningful Internet Systems 2003: CoopIS, DOA, and ODBASE. OTM 2003. Berlin: Springer, 2003. (Lecture Notes in Computer Science, v. 2888). DOI: https://doi.org/10.1007/978-3-540-39964-3_62.
HARRINGTON, P. Machine Learning in action. Shelter Island: Manning Publications, 2012.
HE, H.; MA, Y. Imbalanced learning: foundations, algorithms, and applications. IEEE. New Jersey: John Wiley & Sons, 2013.
JOHN, G. H.; LANGLEY, P. Estimating continuous distributions in bayesian classifiers. arXiv preprint, arXiv:1302.4964, 2013. DOI: https://doi.org/10.48550/arXiv.1302.4964.
MANISH, P. Handling categorical data in Python tutorial. Datacamp, 5 jan. 2020. Disponível em: https://www.datacamp.com/community/tutorials/categorical-data. Acesso em: 30 jan. 2021.
MOHAN, A. Cross-validation for imbalanced datasets. Lumiata, 5 mar. 2019. Disponível em: https://medium.com/lumiata/cross-validation-for-imbalanced-datasets-9d203ba47e8. Acesso em: 12 dez. 2020.
PIMENTEL, M.; ARAUJO, R. #FiqueEmCasa, mas se mantenha ensinando-aprendendo: algumas questões educacionais em tempos de pandemia. SBC Horizontes, 30 mar. 2020. Disponível em: http://horizontes.sbc.org.br/index.php/2020/03/fiqueemcasa/. Acesso em: 3 set. 2020.
RABELO, H.; BURLAMAQUI, A.; VALENTIM, R.; RABELO, D. S. S.; MEDEIROS, S. Utilização de técnicas de mineração de dados educacionais para predição de desempenho de alunos de EaD em ambientes virtuais de aprendizagem. Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação - SBIE), Anais do SBIE 2017 (Proceedings of the SBIE 2017), p. 1527-1536, out. 2017. DOI: http://dx.doi.org/10.5753/cbie.sbie.2017.1527.
ROMERO, C.; VENTURA, S. Educational data mining and learning analytics: an updated survey. WIREs Data Mining and Knowledge Discovery, v. 10, n. 3, e1355, 2020. DOI: https://doi.org/10.1002/widm.1355.
RONALDO, G.; PASSOS, E.; BEZERRA, E. Data Mining: conceitos, técnicas, algoritmos, orientações e aplicações. 2. ed. Rio de Janeiro: Elsevier, 2015.
SANTOS, E. Educação online para além da EAD: um fenômeno da cibercultura. In: CONGRESSO INTERNACIONAL GALEGO-PORTUGUÊS DE PSICOPEDAGOGIA, 10., 2009, Braga, Portugal. Actas (...). Braga: Universidade do Minho, 2009. p. 5658-5671. Disponível em: https://www.educacion.udc.es/grupos/gipdae/documentos/congreso/xcongreso/pdfs/t12/t12c427.pdf. Acesso em: 11 dez. 2020.
SANTOS, M. S.; SOARES, J. P.; ABREU, P. H.; ARAUJO, H.; SANTOS, J. Cross-validation for imbalanced datasets: avoiding overoptimistic and overfitting approaches [Research Frontier]. IEEE Computational Intelligence Magazine, v. 13, n. 4, p. 59-76, 1 nov. 2018. DOI: https://doi.org/10.1109/MCI.2018.2866730.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
• O(s) autor(es) autoriza(m) a publicação do artigo na revista;
• O(s) autor(es) garante(m) que a contribuição é original e inédita e que não está em processo de avaliação em outra(s) revista(s), nem esteja publicado em anais de congressos e/ou portais institucionais;
• A revista não se responsabiliza pelas opiniões, ideias e conceitos emitidos nos textos, por serem de inteira responsabilidade de seu(s) autor(es). Opiniões e perspectivas expressas no texto, assim como a precisão e a procedência das citações, são de responsabilidade exclusiva do(s) autor(es), e contribuem para a promoção dos:
- Princípios FAIR (Findable, Accessible, Interoperable, and Reusable – localizável, acessível, interoperável e reutilizável);
- Princípios DEIA (diversidade, equidade, inclusão e acessibilidade).
• É reservado aos editores o direito de proceder ajustes textuais e de adequação do artigos às normas da publicação.
Responsabilidades dos autores e transferência de direitos autorais
Os autores devem declarar a originalidade do estudo, bem como o fato de que este não foi publicado anteriormente ou está sendo considerado para publicação em outro meio, como periódicos, anais de eventos ou livros. Ao autorizarem a publicação do artigo na Revista Principia, os autores devem também responsabilizar-se pelo conteúdo do manuscrito, cujos direitos autorais, em caso de aprovação, passarão a ser propriedade exclusiva da revista. A Declaração de Responsabilidades dos Autores e Transferência de Direitos Autorais deverá ser assinada por todos os autores e anexada ao sistema como documento suplementar durante o processo de submissão. Clique no link abaixo para fazer o download do modelo.
Esta revista, seguindo as recomendações do movimento de Acesso Aberto, proporciona seu conteúdo em Full Open Access. Assim os autores conservam todos seus direitos permitindo que a Revista Principia possa publicar seus artigos e disponibilizar pra toda a comunidade.
A Revista Principia adota a licença Creative Commons 4.0 do tipo atribuição (CC-BY). Esta licença permite que outros distribuam, remixem, adaptem e criem a partir do seu trabalho, inclusive para fins comerciais, desde que lhe atribuam o devido crédito pela criação original.
Os autores estão autorizados a enviar a versão do artigo publicado nesta revista em repositório institucionais, com reconhecimento de autoria e publicação inicial na Revista Principia.