Avaliação do Impacto de Estratégias de Pré-Processamento de Sequências de Eventos de Aprendizagem em Algoritmos de Mineração de Padrões Sequenciais
##plugins.themes.bootstrap3.article.main##
Resumo
Este trabalho é aplicado ao contexto de cursos técnicos a distância da rede pública de ensino, com base em dados reais extraídos da plataforma Moodle. A motivação central do estudo é apoiar educadores e gestores na tomada de decisões pedagógicas baseadas em dados de logs de interação dos usuários, indo além das tradicionais métricas de desempenho. A pesquisa tem como objetivo analisar como a Mineração de Padrões Sequenciais (SPM) pode contribuir para a compreensão dos comportamentos de aprendizagem de estudantes em Ambientes Virtuais de Aprendizagem (AVAs). Por meio do uso do algoritmo PrefixSpan, buscou-se identificar sequências frequentes de eventos relacionadas às interações dos alunos com os recursos da plataforma, de modo a avaliar que combinações de estratégias de pré-processamento eram mais eficazes na identificação de padrões significativos que pudessem ser associados ao desempenho acadêmico. A metodologia adotada segue o modelo CRoss Industry Process for Data Mining (CRISP-DM), contemplando as etapas de entendimento do negócio, entendimento e preparação dos dados, modelagem e avaliação. A base de dados utilizada contém dados de interação de 2.085 estudantes da disciplina “Cargos e Salários”, de um curso técnico de Recursos Humanos ofertado na modalidade EaD, com eventos registrados referentes a acessos a materiais, submissões de atividades e participações em fóruns, dentre outros. Durante o pré-processamento, foram aplicadas diferentes estratégias, já definidas na literatura, para refinar os dados: categorização temporal dos eventos, remoção de eventos repetidos em sequência, fusão de eventos complexos previsíveis em eventos únicos e a divisão dos acessos em sessões com base na distância temporal entre os eventos, buscando-se assim avaliar o impacto dessas diferentes estratégias para a identificação de padrões relevantes e a redução de padrões ruidosos. A combinação dessas técnicas resultou em vinte e quatro bases distintas para a primeira e quarta atividades avaliativas da disciplina, cada uma representando um cenário com uma ou mais combinações de estratégias aplicadas. Os experimentos revelaram que o uso dessas técnicas de pré-processamento impacta diretamente tanto a quantidade quanto a qualidade dos padrões identificados. As bases processadas com múltiplas estratégias apresentaram padrões mais concisos, semanticamente ricos e com maior potencial interpretativo. Também foi realizada uma segmentação dos estudantes com base no desempenho acadêmico, separando-os em grupos com boas e más notas, de modo a identificar padrões comportamentais específicos para cada perfil. A análise revelou que a SPM pode captar nuances relevantes que distinguem as práticas dos diferentes grupos. Em conclusão, este estudo evidencia que a SPM, quando associada a um pré-processamento criterioso dos dados educacionais, pode revelar informações valiosas sobre os processos de aprendizagem em cursos online. Os padrões identificados fornecem subsídios relevantes para intervenções pedagógicas personalizadas, promovendo uma educação mais responsiva e baseada em evidências. Como trabalhos futuros, recomenda-se a ampliação da abordagem para outras instituições, o desenvolvimento de ferramentas que integrem esse tipo de análise aos sistemas de gestão de aprendizagem, possibilitando um acompanhamento mais eficaz dos estudantes ao longo do tempo, a generalização da abordagem com a aplicação dos métodos a diferentes disciplinas e contextos educacionais, buscando reforçar o potencial da técnica para uso em larga escala, a implementação de novas métricas da literatura para avaliação dos padrões resultantes, assim como a criação de novas métricas mais específicas para este trabalho, realizar uma melhor discussão das características de cada grupo de alunos que fazem parte de cada um dos padrões, buscando uma forma de expressar os resultados graficamente e realizar uma análise qualitativa envolvendo professores experientes em ensino a distância e buscar estratégias que considerem o tempo que o aluno permaneceu em cada evento na sequência.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Seção
Engenharia da Computação e Sistemas