- Submissão
- Submissão online
- Diretrizes para Autores
- Declaração de Direito Autoral
- Política de Privacidade
- Sobre este sistema de publicação
- Sobre
- Foco e Escopo
- Equipe Editorial
- História da Revista Principia
- Normas de homogeneidade
- Comitê de ética
- Política de ética para autores, Conselho Editorial e avaliadores
- Política de retirada de artigos
- Perguntas e respostas frequentes
- Equipe de apoio da Revista Principia
- Conflito de interesses
- Plano de Desenvolvimento Editorial da Revista Principia
- Princípios DEIA (Diversidade, Equidade, Inclusão e Acessibilidade)
- Normas para números especiais na Revista Principia
- Princípios FAIR
- Curso de Escrita Científica - ACS - Prof. Osvaldo
- Sites e manuais sobre boas práticas científicas
Predição precoce de problemas de desempenho de estudantes em modalidade de educação on-line: um estudo de caso no ensino médio integrado
Resumo
A necessidade de acompanhamento dos estágios de aprendizado discente e suas dificuldades de forma precoce tomou uma dimensão ainda maior nesses tempos recentes de pandemia de COVID-19 e de ensino on-line. Nesse panorama, este trabalho apresenta uma abordagem para predizer, de forma precoce, o desempenho de estudantes com probabilidade de reprovação superior a 50% em disciplinas específicas que ocorrem em ensino on-line. Para analisar e avaliar a viabilidade da abordagem proposta foi realizado um estudo de caso com dados do ensino técnico integrado do Campus Monteiro do IFPB a partir de dois cenários: (i) para turmas do primeiro ano e (ii) para turmas do segundo e terceiro anos. Foi construído um conjunto de dados com dados reais originados do Google Sala de Aula e do SUAP. Com base no conjunto de dados criado, foram construídos e avaliados modelos de classificação supervisionada usando os métodos Naive Bayes, KNN (K Nearest Neighbors), SVM (Support Vector Machine), Random Forest, Gradient Boosting e Extreme Gradient Boosting. Os métodos de classificação SVM e Gradient Boosting obtiveram especificidade superiores a 93% e 80%, respectivamente.
Palavras-chave
aprendizado de máquina; classificação supervisionada; educação on-line; mineração de dados educacionais; predição de desempenho de estudantes
Texto completo:
Referências
ALBON, C. Machine Learning with Python cookbook: practical solutions from preprocessing to Deep Learning. 1. ed. Sebastopol: O’Reilly Media, 2018.
BARROS, R. P.; SANTANA JUNIOR, O. V.; SILVA, I. R. M.; SANTOS, L. F.; CÂMARA NETO, V. R. Predição do rendimento dos alunos em lógica de programação com base no desempenho das disciplinas do primeiro período do curso de ciências e tecnologia utilizando técnicas de mineração de dados. Brazilian Journal of Development, v. 6, n. 1, p. 2523-2534, 16 jan. 2020. DOI: https://doi.org/10.34117/bjdv6n1-186.
BREIMAN, L. Random forests. Machine Learning, v. 45, n. 1, p. 5-32, 2001. DOI: https://doi.org/10.1023/A:1010933404324.
CANO, A.; LEONARD, J. D. Interpretable Multiview Early Warning System Adapted to Underrepresented Student Populations. IEEE Transactions on Learning Technologies, v. 12, n. 2, p. 198-211, 1 abr. 2019. DOI: https://doi.org/10.1109/TLT.2019.2911079.
CHANLEKHA, H.; NIRAMITRANON, J. Student performance prediction model for early-identification of at-risk students in traditional classroom settings. In: INTERNATIONAL CONFERENCE ON MANAGEMENT OF DIGITAL ECOSYSTEMS, 10., 2018, Tokyo. Proceedings (...). New York: Association for Computing Machinery, 2018. DOI: https://doi.org/10.1145/3281375.3281403.
CHAPMAN, P.; CLINTON, J.; KERBER, R.; KHABAZA, T.; REINARTZ, T.P.; SHEARER, C.; WIRTH, R. CRISP-DM 1.0: step-by-step data mining guide. [S.l.]: CRISP-DM Consortium, 2000. Disponível em: https://www.kde.cs.uni-kassel.de/wp-content/uploads/lehre/ws2012-13/kdd/files/CRISPWP-0800.pdf. Acesso em: 30 jan. 2021.
CHEN, T.; GUESTRIN, C. XGBoost: A Scalable Tree Boosting System. In: ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING, 22., 2016, San Francisco. Proceedings (...). New York: ACM, 2016. DOI: https://doi.org/10.1145/2939672.2939785.
CORTES, C.; VAPNIK, V. Support-vector networks. Machine Learning, v. 20, n. 3, p. 273-297, set. 1995. DOI: https://doi.org/10.1007/BF00994018.
FERRARI, D.; CASTRO, L. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. 1. ed. São Paulo: Saraiva, 2016.
FRIEDMAN, J. H. Greedy function approximation: A gradient boosting machine. The Annals of Statistics, v. 29, n. 5, p. 1189-1232, 2001. DOI: https://doi.org/10.1214/aos/1013203451.
GUO, G.;WANG, H.; BELL, D.; BI, Y.; GREER, K. KNN model-based approach in classification. In: MEERSMAN, R.; TARI, Z.; SCHMIDT, D. C. (ed.). On The Move to Meaningful Internet Systems 2003: CoopIS, DOA, and ODBASE. OTM 2003. Berlin: Springer, 2003. (Lecture Notes in Computer Science, v. 2888). DOI: https://doi.org/10.1007/978-3-540-39964-3_62.
HARRINGTON, P. Machine Learning in action. Shelter Island: Manning Publications, 2012.
HE, H.; MA, Y. Imbalanced learning: foundations, algorithms, and applications. IEEE. New Jersey: John Wiley & Sons, 2013.
JOHN, G. H.; LANGLEY, P. Estimating continuous distributions in bayesian classifiers. arXiv preprint, arXiv:1302.4964, 2013. DOI: https://doi.org/10.48550/arXiv.1302.4964.
MANISH, P. Handling categorical data in Python tutorial. Datacamp, 5 jan. 2020. Disponível em: https://www.datacamp.com/community/tutorials/categorical-data. Acesso em: 30 jan. 2021.
MOHAN, A. Cross-validation for imbalanced datasets. Lumiata, 5 mar. 2019. Disponível em: https://medium.com/lumiata/cross-validation-for-imbalanced-datasets-9d203ba47e8. Acesso em: 12 dez. 2020.
PIMENTEL, M.; ARAUJO, R. #FiqueEmCasa, mas se mantenha ensinando-aprendendo: algumas questões educacionais em tempos de pandemia. SBC Horizontes, 30 mar. 2020. Disponível em: http://horizontes.sbc.org.br/index.php/2020/03/fiqueemcasa/. Acesso em: 3 set. 2020.
RABELO, H.; BURLAMAQUI, A.; VALENTIM, R.; RABELO, D. S. S.; MEDEIROS, S. Utilização de técnicas de mineração de dados educacionais para predição de desempenho de alunos de EaD em ambientes virtuais de aprendizagem. Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação - SBIE), Anais do SBIE 2017 (Proceedings of the SBIE 2017), p. 1527-1536, out. 2017. DOI: http://dx.doi.org/10.5753/cbie.sbie.2017.1527.
ROMERO, C.; VENTURA, S. Educational data mining and learning analytics: an updated survey. WIREs Data Mining and Knowledge Discovery, v. 10, n. 3, e1355, 2020. DOI: https://doi.org/10.1002/widm.1355.
RONALDO, G.; PASSOS, E.; BEZERRA, E. Data Mining: conceitos, técnicas, algoritmos, orientações e aplicações. 2. ed. Rio de Janeiro: Elsevier, 2015.
SANTOS, E. Educação online para além da EAD: um fenômeno da cibercultura. In: CONGRESSO INTERNACIONAL GALEGO-PORTUGUÊS DE PSICOPEDAGOGIA, 10., 2009, Braga, Portugal. Actas (...). Braga: Universidade do Minho, 2009. p. 5658-5671. Disponível em: https://www.educacion.udc.es/grupos/gipdae/documentos/congreso/xcongreso/pdfs/t12/t12c427.pdf. Acesso em: 11 dez. 2020.
SANTOS, M. S.; SOARES, J. P.; ABREU, P. H.; ARAUJO, H.; SANTOS, J. Cross-validation for imbalanced datasets: avoiding overoptimistic and overfitting approaches [Research Frontier]. IEEE Computational Intelligence Magazine, v. 13, n. 4, p. 59-76, 1 nov. 2018. DOI: https://doi.org/10.1109/MCI.2018.2866730.
Visitas a este artigo: 1253
Total de downloads do artigo: 744