Aplicação de Redes Neurais para Evasão Escolar
##plugins.themes.bootstrap3.article.main##
Resumo
A evasão no ensino superior brasileiro representa um desafio significativo para instituições e estudantes. Para as universidades, resulta em salas vazias, ociosidade de docentes e subutilização da infraestrutura. Para os alunos, implica perda de tempo, recursos e, muitas vezes, dificuldades financeiras que contribuem para o abandono dos estudos. Segundo dados do ensino superior, entre 2018 e 2022, a taxa acumulada de evasão alcançou 57,2%, com apenas 25,6% dos estudantes concluindo a graduação (INSTITUTO SEMESP, 2024). Esses índices evidenciam a necessidade de medidas eficazes para previsão e prevenção da evasão, contribuindo para a melhoria da retenção e do planejamento acadêmico. Apesar da existência de programas voltados para a redução da evasão, suas causas são variadas, tornando a identificação precoce de alunos em risco de abandono, uma estratégia fundamental para mitigar o problema. Considerando isso, este estudo propõe o uso de redes neurais artificiais para a previsão da evasão de estudantes no ensino superior. Com o objetivo de aplicar modelos de redes neurais artificiais, especificamente Multilayer Perceptron (MLP) e Extreme Learning Machine (ELM), para prever a evasão de alunos no ensino superior, utilizando uma base de dados pública do Instituto Politécnico de Portalegre (Portugal), composta por informações demográficas, socioeconômicas e acadêmicas de 4.424 estudantes de 17 cursos de graduação da instituição (REALINHO et al., 2021). Neste trabalho foi utilizado uma metodologia inspirada na CRISP-DM (SHEARER, 2000) como base para o fluxo de pesquisa e desenvolvimento do projeto, desde a aquisição da base de dados até o a análise dos resultados da previsão das redes neurais. Primeiro, foi realizada uma busca por artigos que referenciam o trabalho de apresentação da base de dados do Instituto Politécnico de Portalegre, com o objetivo de identificar estudos que a utilizam, bem como artigos que abordam o tema da previsão de evasão escolar. Depois, a base de dados foi analisada, com foco na identificação de suas variáveis, na forma como os alunos foram classificados (graduados, matriculados ou evadidos) e no método utilizado para sua construção. Com base em trabalhos anteriores que utilizaram a base, além de testes preliminares utilizando as redes neurais MLP e ELM, foi realizado o pré-processamento dos dados, removendo os alunos classificados como "matriculados", escolhendo a proporção 80:20 para treino/teste, e mantendo todas as variáveis, entre outros ajustes. Assim, foram definidas as configurações dos modelos MLP e ELM, abrangendo desde o algoritmo de padronização dos dados e a divisão treino-teste, até a escolha dos hiperparâmetros, considerando as limitações e capacidades das bibliotecas utilizadas. Após os testes, os modelos MLP e ELM foram avaliados com base na especificidade, uma das poucas métricas que medem diretamente o desempenho na identificação da classe negativa (POWERS, 2020), sendo neste caso os alunos classificados como evadidos, e no tempo de execução da melhor métrica obtida, como indicador de custo computacional. Por fim, com base nos resultados, foram discutidas possíveis justificativas para o desempenho observado, bem como potenciais aplicações das redes neurais em instituições de ensino superior. Portanto, ambos os modelos testados apresentaram resultados satisfatórios no contexto da previsão de evasão escolar, considerando as métricas de especificidade e tempo de execução. A especificidade, que mede a capacidade de identificar corretamente os alunos evadidos (classe negativa), foi de 87,00% para o MLP, indicando maior precisão na detecção de casos reais de evasão. Já o ELM obteve uma especificidade de 81,59%, revelando uma leve tendência a classificar erroneamente alguns alunos evadidos como graduados. No que se refere ao tempo de execução das melhores configurações, observou-se uma diferença significativa entre os modelos. O MLP, mesmo utilizando GPU dedicada, levou 4,71 segundos para realizar a predição em sua configuração mais eficiente. Por outro lado, o ELM concluiu o mesmo processo em apenas 0,01477 segundos, executando totalmente em CPU. Essa discrepância evidencia a vantagem computacional do ELM, especialmente em contextos que demandam processamento rápido ou com infraestrutura limitada. Esses resultados demonstram que ambos os modelos são viáveis para aplicação prática, mas com características técnicas distintas: o MLP oferece maior precisão na identificação de alunos em risco de evasão, enquanto o ELM se destaca pela agilidade e eficiência computacional. A escolha entre os dois deve considerar o equilíbrio entre desempenho preditivo e recursos disponíveis, conforme a realidade e os objetivos de cada instituição. Considerando seu uso por instituições de ensino, o modelo MLP demonstrou ser uma rede extremamente versátil e configurável, permitindo sua adaptação a diferentes realidades e exigências institucionais. Sua flexibilidade técnica, no entanto, vem acompanhada de uma maior demanda computacional, exigindo ambiente especializado e, preferencialmente, suporte de hardware com aceleração via GPU. Dessa forma, sua utilização é mais adequada a instituições que possuam maior infraestrutura tecnológica e interesse em configurações customizadas e precisas. O modelo ELM, por outro lado, apresentou um desempenho satisfatório com baixo custo computacional, podendo ser executado integralmente em CPU, o que o torna acessível a instituições com recursos mais limitados. Ainda assim, sua eficácia depende fortemente da escolha dos hiperparâmetros e da sensibilidade à distribuição dos dados, além de sua estrutura não permitir ajustes dinâmicos de pesos, o que reduz sua adaptabilidade em relação ao MLP. Apesar disso, sua velocidade de execução e facilidade de implementação o tornam uma alternativa prática para sistemas de monitoramento e triagem rápida. Contudo, a escolha entre os modelos pode variar conforme a necessidade institucional: priorizar menos erros e aceitar um tempo de processamento mais elevado, quando se quer ser mais seletivo e criterioso (MLP), ou optar por uma solução muito mais rápida, com excelente detecção de evasão, mas com maior risco de classificar incorretamente alguns alunos que possuam chance de evadir (ELM), sendo que essa escolha deve ser feita sempre considerando a realidade dos alunos, da instituição e de outros fatores que possam contribuir para a evasão.
Palavras-chave: Evasão Escolar; Redes Neurais; Multilayer Perceptron; Extreme Learning Machine.
Referências
INSTITUTO SEMESP. 14ª edição do Mapa do Ensino Superior no Brasil. São Paulo, 2024
REALINHO, Valentim; VIEIRA MARTINS, Mónica; MACHADO, Jorge; BAPTISTA, Luís. Predict Students' Dropout and Academic Success. UCI Machine Learning Repository, 2021.
SHEARER, Colin. The CRISP-DM model: the new blueprint for data mining. Journal of Data Warehousing, v. 5, p. 13–22, 2000.
POWERS, David M. W. Evaluation: from precision, recall and F-measure to ROC, informedness, markedness and correlation. Journal of Machine Learning Technologies, v. 2, n. 1, p. 37–63, 2020.
Palavras-chave: Evasão Escolar; Redes Neurais; Multilayer Perceptron; Extreme Learning Machine.
Referências
INSTITUTO SEMESP. 14ª edição do Mapa do Ensino Superior no Brasil. São Paulo, 2024
REALINHO, Valentim; VIEIRA MARTINS, Mónica; MACHADO, Jorge; BAPTISTA, Luís. Predict Students' Dropout and Academic Success. UCI Machine Learning Repository, 2021.
SHEARER, Colin. The CRISP-DM model: the new blueprint for data mining. Journal of Data Warehousing, v. 5, p. 13–22, 2000.
POWERS, David M. W. Evaluation: from precision, recall and F-measure to ROC, informedness, markedness and correlation. Journal of Machine Learning Technologies, v. 2, n. 1, p. 37–63, 2020.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Seção
Engenharia da Computação e Sistemas