Comparação de Modelos Estatísticos e Modelos de Machine Learning Multinível na Previsão do Desempenho de Alunos do ENEM com Base na Gestão de Tempo: Uma Hipótese em Investigação. Uma Hipótese em Investigação.

##plugins.themes.bootstrap3.article.main##

Pricylla Santos Cavalcante do NASCIMENTO
Fernanda Maria Ribreiro Alencar, Dr

Resumo

Os modelos multiníveis, de acordo com Pires (2020), surgem como uma solução para limitações dos modelos de regressão tradicionais quando lidam com dados agrupados em hierarquias. A principal desvantagem dos modelos tradicionais é a incapacidade de considerar a hierarquização das observações, o que pode levar a conclusões equivocadas. Os modelos multiníveis superam essa limitação ao levar em conta a estrutura de agrupamento das observações, permitindo a definição de equações em cada nível. Essas equações são posteriormente combinadas em um único modelo que melhor se ajusta aos dados (PIRES, 2020). Esses modelos multiníveis possuem duas partes essenciais: a fixa e a aleatória. A parte fixa é comum a todos os grupos, enquanto a parte aleatória reflete a especificidade de cada grupo, sendo estimada pela variabilidade nos diferentes níveis. Em modelos de regressão multinível, os coeficientes do primeiro nível são tratados como aleatórios no segundo nível. Essa abordagem permite capturar a variação tanto a nível global quanto dentro dos grupos, tornando os modelos multiníveis mais flexíveis e robustos para lidar com estruturas hierárquicas nos dados (PIRES, 2020). O desempenho acadêmico e a aprendizagem são influenciados por diversos fatores, além da inteligência e dedicação aos estudos. Esses fatores incluem aspectos pessoais e internos do estudante, como fatores orgânicos, cognitivos, afetivos e motivacionais, bem como a influência da família, do grupo social e do ambiente escolar. A interação entre esses elementos desempenha um papel crucial no processo de aprendizado e no desempenho acadêmico de um indivíduo (ANDRADE, 2014). A gestão do tempo engloba um conjunto de técnicas que visa otimizar a execução de tarefas, garantindo a manutenção da produtividade e eficiência. Em essência, trata-se da aplicação de processos e ferramentas que auxiliam na conclusão de atividades e projetos dentro dos prazos estabelecidos, assegurando resultados satisfatórios (MELO; FARIAS, 2015). Este trabalho visa comparar a eficácia dos modelos estatísticos multiníveis e dos algoritmos de machine learning multiníveis na previsão do desempenho dos alunos do ENEM, utilizando dados sobre gestão de tempo. O objetivo é identificar qual abordagem fornece previsões mais precisas e insights mais úteis para educadores e gestores. A análise será realizada com base nos dados de desempenho dos alunos do ensino médio no ENEM 2022 e seus hábitos de estudo. Os dados foram coletados do portal de microdados do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) e incluem informações demográficas, socioeconômicas, e dados sobre o tempo gasto em cada seção do exame. Os microdados utilizados foram anonimizados, garantindo a privacidade dos participantes. A coleta de dados será realizada a partir dos microdados do ENEM 2022 disponibilizados pelo INEP, estruturados em níveis hierárquicos como escolas, turmas e alunos. Para modelos estatísticos multinível, serão utilizados Modelos Lineares Hierárquicos (HLM) e Modelos de Regressão Logística Multinível, implementados com o pacote lme4 no R. Para modelos de machine learning multinível, serão empregados Random Forests Multinível, Redes Neurais Convolucionais (CNNs) adaptadas para dados hierárquicos e Gradient Boosting Machines (GBM), utilizando bibliotecas como scikit-learn, TensorFlow e XGBoost. Os procedimentos de avaliação incluirão métricas como Raiz do Erro Quadrático Médio (RMSE), Acurácia, Área Sob a Curva ROC (AUC) e Tempo de Treinamento/Inferência, com validação cruzada k-fold para robustez das estimativas. Espera-se comparar a performance dos modelos em termos de RMSE e AUC, discutir a interpretabilidade dos resultados dos modelos estatísticos versus os de machine learning e analisar a eficiência computacional comparando o tempo de treinamento e inferência entre os modelos. Espera-se que os modelos de machine learning apresentem maior precisão preditiva, enquanto os modelos estatísticos serão mais fáceis de interpretar. A eficiência computacional dos modelos de machine learning será avaliada considerando o tempo de treinamento e inferência. A síntese dos achados esperados sugere que os modelos de machine learning terão maior precisão preditiva e capacidade de capturar relações complexas nos dados, enquanto os modelos estatísticos oferecerão melhor interpretabilidade e serão mais adequados para inferência causal. As implicações para a educação incluem a utilização dos insights gerados para melhorar a gestão de tempo dos estudantes, potencialmente aumentando seu desempenho, e as limitações do estudo serão discutidas, considerando as restrições dos dados e das abordagens metodológicas utilizadas.
 

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas