Análise comparativa entre redes neurais convolucionais e o ChatGPT-4 em termos de desempenho, custo e tempo de processamento na classificação de imagens

Autores

DOI:

https://doi.org/10.18265/2447-9187a2025id8688

Palavras-chave:

Aprendizado Profundo, Classificação de Imagens, Classificação Multiclasse, CNNs, LLM.

Resumo

Este estudo apresenta uma comparação entre os resultados obtidos de Redes Neurais Convolucionais (Convolutional Neural Networks – CNNs) e ChatGPT-4 na classificação de imagens com ou sem desfoque. Comparar CNNs com ChatGPT-4 é relevante devido ao uso crescente de grandes modelos de linguagem na sociedade, que têm sido amplamente aplicados em vários domínios, incluindo tarefas de análise de imagens. O problema de classificação abordado é multiclasse, abrangendo imagens nítidas, desfoque de movimento e desfoque devido ao desfoque. Classificar imagens com ou sem desfoque apresenta um desafio devido às semelhanças entre diferentes tipos de desfoque e à presença de desfoques leves, que podem ser difíceis de detectar. As CNNs foram treinadas e testadas usando um conjunto de dados público do Kaggle, e os mesmos conjuntos de dados foram usados para avaliar o ChatGPT-4, acompanhados por consultas cuidadosamente projetadas. O tamanho do conjunto de dados variou entre 1.050 e 8.100 imagens, totalmente balanceado entre as classes. A metodologia incluiu pré-processamento de dados com transformadas de Fourier e Haar, implementação do modelo CNN, validação do modelo e comparação com resultados obtidos usando ChatGPT-4. Essa abordagem permitiu investigar qual método fornece o melhor desempenho, custo e tempo de processamento. Após experimentar todo o conjunto de dados, o modelo CNN com o melhor desempenho usou a transformada de Haar, alcançando uma precisão média de 0,8889, uma precisão média de 0,8913, um recall médio de 0,9503 e uma Área sob a Curva (Area Under the Curve – AUC) média de 0,9503. O melhor resultado obtido com ChatGPT-4 mostrou uma precisão média de 0,8198, uma precisão média de 0,8175, um recall médio de 0,8198 e uma AUC média de 0,8649. Este tipo de análise é de grande relevância, dado o potencial do ChatGPT-4 como uma ferramenta de suporte à decisão em vários campos, como saúde e educação. Este estudo contribui para o estado da arte ao fornecer insights valiosos para pesquisadores e empresas que visam otimizar seus processos de análise de imagens usando inteligência artificial. Trabalhos futuros devem incluir uma análise mais aprofundada dos algoritmos usados, estudos controlados e a expansão do conjunto de dados.

Downloads

Não há dados estatísticos.

Referências

ABDALJALEEL, M.; BARAKAT, M.; ALSANAFI M.; SALIM, N. A.; ABAZID, H.; MALAEB, D.; MOHAMMED, A. H.; HASSAN, B. A. R.; WAYYES, A. M.; FARHAN, S. S.; KHATIB, S. E.; RAHAL, M.; SAHBAN, A.; ABDELAZIZ, D. H.; MANSOUR, N. O.; ALZAYER, R.; KHALIL, R.; FEKIH-ROMDHANE, F.; HALLIT, R.; HALLIT, S.; SALLAM, M.. A multinational study on the factors influencing university students’ attitudes and usage of ChatGPT. Scientific Reports, v. 14, 1983, 2024. DOI: https://doi.org/10.1038/s41598-024-52549-8.

ADESHOLA, I.; ADEPOJU, A. P. The opportunities and challenges of ChatGPT in education. Interactive Learning Environments, 2023. DOI: https://doi.org/10.1080/10494820.2023.2253858.

ALGHAMDI, R. Exploring the impact of ChatGPT-generated feedback on technical writing skills of computing students: a blinded study. Education and Information Technologies, v. 29, p. 18901-18926, 2024. DOI: https://doi.org/10.1007/s10639-024-12594-2.

BAHRINI, A.; KHAMOSHIFAR, M.; ABBASIMEHR, H.; RIGGS, R. J.; ESMAEILI, M.; MAJDABADKOHNE, R. M.; PASEHVAR, M. ChatGPT: applications. opportunities. and threats. In: SYSTEMS AND INFORMATION ENGINEERING DESIGN SYMPOSIUM (SIEDS), 2023, Charlottesville. Proceedings […]. Charlottesville: IEEE, 2023. p. 274-279. DOI: https://doi.org/10.1109/SIEDS58326.2023.10137850.

BROWN, T. B.; MANN, B.; RYDER, N.; SUBBIAH, M.; KAPLAN, J.; DHARIWAL, P.; NEELAKANTAN, A.; SHYAM, P.; SASTRY, G.; ASKELL, A.; AGARWAL, S.; HERBERT-VOSS, A.; KRUEGER, G.; HENIGHAN, T.; CHILD, R.; RAMESH, A.; ZIEGLER, D. M.; WU, J.; WINTER, C.; HESSE, C.; CHEN, M.; SIGLER, E.; LITWIN, M.; GRAY, S.; CHESS, B.; CLARK, J.; BERNER, C.; MCCANDLISH, S.; RADFORD, A.; SUTSKEVER, I.; AMODEI, D. Language models are few-shot learners. In: INTERNATIONAL CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS, 34., 2020, Vancouver. Proceedings […]. Vancouver: ACM, 2020, p. 1877-1901. Disponível em: https://dl.acm.org/doi/abs/10.5555/3495724.3495883. Acesso em: 24 nov. 2024.

CHEN, T.-J. A novel image blurring detection scheme using spatial autocorrelation. In: IRISH SIGNALS AND SYSTEMS CONFERENCE (ISSC), 34., 2023, Dublin. Proceedings […]. Dublin: IEEE, 2023. DOI: https://doi.org/10.1109/ISSC59246.2023.10162072.

DEPURU, S.; AMALA, K.; SUPRIYA, P.; REDDY, A. B.; GIREESH R. S. VGG-16 technique to reduce the global food crises and enhance the crop yields: deep learning approaches. In: INTERNATIONAL CONFERENCE ON APPLIED ARTIFICIAL INTELLIGENCE AND COMPUTING (ICAAIC), 3., 2024, Salem. Proceedings […]. Salem: IEEE, 2024. p. 596-599. DOI: https://doi.org/10.1109/ICAAIC60222.2024.10575562.

LEE, S.; KANG, Q.; MADIREDDY, S.; BALAPRAKASH, P.; AGRAWAL, A.; CHOUDHARY, A.; ARCHIBALD, R.; LIAO, W. Improving scalability of parallel CNN training by adjusting mini-batch size at run-time. In: IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA), 2019, Los Angeles. Proceedings […]. Los Angeles: IEEE, 2019. p. 830-839. DOI: https://doi.org/10.1109/BigData47090.2019.9006550.

LI, J.; DADA, A.; PULADI, B.; KLEESIEK, J.; EGGER, J. ChatGPT in healthcare: a taxonomy and systematic review. Computer Methods and Programs in Biomedicine, v. 245, 108013, 2024. DOI: http://dx.doi.org/10.1016/j.cmpb.2024.108013.

LI, M.; MA, Z.; WANG, Y. G.; ZHUANG, X. Fast Haar transforms for graph neural networks. Neural Networks, v. 128, n. 4, p. 188-198. 2020. DOI: http://dx.doi.org/10.1016/j.neunet.2020.04.028.

NAZ, I.; ROBERTSON, R. Exploring the feasibility and efficacy of ChatGPT3 for personalized feedback in teaching. Electronic Journal of e-Learning, v. 22, n. 2, p. 98-111, 2024. DOI: https://doi.org/10.34190/ejel.22.2.3345.

PRAVEEN, B.; ISRAVEL, D. P.; DHAS, J. P. M. VGG-16 based deep learning approach for plant species detection. In: INTERNATIONAL CONFERENCE ON ADVANCES IN MODERN AGE TECHNOLOGIES FOR HEALTH AND ENGINEERING SCIENCE (AMATHE), 2024, Shivamogga. Proceedings […]. Shivamogga: IEEE, 2024. p. 1-6. DOI: http://dx.doi.org/10.1109/AMATHE61652.2024.10582179.

PUTRANTO, A.; LIN, T.-H.; HUANG, B.-X. Deep learning-integrated electromagnetic imaging for evaluating reinforced concrete structures in water-contact scenarios. Automation in Construction, v. 164, 105459, 2024. DOI: https://doi.org/10.1016/j.autcon.2024.105459.

RAO, K. R.; KIM, D. N.; HWANG, J. J. Fast Fourier transform: algorithms and applications. Dordrecht: Springer, 2010. DOI: https://doi.org/10.1007/978-1-4020-6629-0.

SILVA, L. C.; CÉSAR SOBRINHO, Á. A. C.; CORDEIRO, ,T. D.; MELO, R. F.; BITTENCOURT, I. I.; MARQUES, L. B.; MATOS, D. D. M. C.; SILVA, A. P.; ISOTANI, S. Applications of convolutional neural networks in education: a systematic literature review. Expert Systems with Applications, v. 231, 120621, 2023. DOI: https://doi.org/10.1016/j.eswa.2023.120621.

SINGH, J.; ZOUHAR, V.; SACHAN, M. Enhancing textbooks with visuals from the web for improved learning. In: CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING (EMNLP 2023), 2023, Singapore. Proceedings […]. Singapore: ACL, 2023. p. 11931-11944. DOI: https://doi.org/10.3929/ethz-b-000653494.

SOBAIH, A. E. E.; ELSHAER, I. A.; HASANEIN, A. M. Examining students’ acceptance and use of ChatGPT in Saudi Arabian higher education. European Journal of Investigation in Health. Psychology and Education, v. 14, n. 3, p. 709-721, 2024. DOI: http://dx.doi.org/10.3390/ejihpe14030047.

SOBRINHO. Á.; BITTENCOURT, I. I.; SILVEIRA, A. C. M.; SILVA, A. P.; DERMEVAL, D.; MARQUES, L. B.; RODRIGUES, N. C. I.; SOUZA, A. C. S.; FERREIRA, R.; ISOTANI, S. Towards digital transformation of the validation and triage process of textbooks in the Brazilian educational policy. Sustainability, v. 15, n. 7, 5861, 2023. DOI: https://doi.org/10.3390/su15075861.

TAN, M.; LE, Q. EfficientNet: rethinking model scaling for convolutional neural networks. In: INTERNATIONAL CONFERENCE ON MACHINE LEARNING (ICML), 3., 2019, Long Beach. Proceedings […]. Long Beach: ICML, 2019. p. 6105-6114. Disponível em: http://proceedings.mlr.press/v97/tan19a.html. Acesso em: 24 nov. 2024.

TIWARI, S. A blur classification approach using deep convolution neural network. International Journal of Information System Modeling and Design (IJISMD), v. 11, n. 1, p. 93-111, 2020. DOI: https://doi.org/10.4018/IJISMD.2020010106.

VASWANI, A.; SHAZEER, N.; USZKOREIT, J.; JONES, L.; GOMEZ, A. N.; KAISER, L.; POLOSHUKHIN, I. Attention is all you need. In: CONFERENCE ON NEURAL PROCESSING SYSYTEMS (NIPS 2017), 31., Long Beach. Proceedings […]. Long Beach, 2017. Disponível em: https://papers.nips.cc/paper_files/paper/2017/hash/3f5ee243547dee91fbd053c1c4a845aa-Abstract.html. Acesso em: 24 nov. 20204.

WANG, R.; LI, W.; ZHANG, L. Blur image identification with ensemble convolution neural networks. Signal Processing, v. 155, p. 73-82, 2019. DOI: https://doi.org/10.1016/j.sigpro.2018.09.027.

WANG, R.; LI, W.; LI, R.; ZHANG, L. Automatic blur type classification via ensemble SVM. Signal Processing: Image Communication, v. 71, p. 24-35, 2019. DOI: https://doi.org/10.1016/j.image.2018.08.003.

XU, X.; THIEN, L. M. Unleashing the power of perceived enjoyment: exploring Chinese undergraduate EFL learners’ intention to use ChatGPT for English learning. Journal of Applied Research in Higher Education, Ahead of Print, 2024. DOI: https://doi.org/10.1108/JARHE-12-2023-0555.

Downloads

Publicado

2024-12-17

Edição

Seção

Ciência da Computação