Um Modelo para Identificação de Estilos de Aprendizagem em Estudantes de Engenharia Usando Processamento de Linguagem Natural

##plugins.themes.bootstrap3.article.main##

Tiago Medeiros Guedes
Cleyton Mário de Oliveira Rodrigues

Resumo

Nas últimas décadas, nota-se um crescente aumento nas pesquisas sobre como os estudantes adquirem, aprendem e processam conhecimento. Pesquisadores buscaram entender como os Estilos de Aprendizagem (EA) podem se tornar adaptativos para cada estudante, levando em consideração suas características individuais, mas se adaptando para contemplar os variados meios de aprender (Schmitt; Domingues, 2016). Como existem muitos estilos, é uma tarefa desafiadora determinar e prever o EA de um estudante individualmente. Adotar um método pedagógico padrão não é apropriado para melhorar o aprendizado de todos os alunos. Portanto, é essencial elaborar e adotar diferentes pedagogias para diferentes tipos de alunos (Ramírez-Correa et al., 2021). Dentre os Modelos de Estilos de Aprendizagem encontrados na literatura, o Modelo proposto por Felder E Silverman (1988) se destaca, em função de apresentar simultaneamente múltiplas dimensões do aprendizado e, desta maneira, fornece uma visão detalhada das preferências dos estudantes. Diante da necessidade da personalização da aprendizagem, buscando a necessidade de utilizar novos métodos que aprimoram o processo de ensino e inclusão da diversidade dos perfis dos estudantes, a proposta desta pesquisa se molda utilizar técnicas de Processamento de Linguagem Natural (PLN) com o objetivo de automatizar e melhorar a identificação dos EA destes estudantes de engenharia e áreas afins. Buscar novos métodos de identificação de EA combinando questionários com Processamento de Linguagem Natural (PLN) pode apresentar uma alternativa automatizada e eficiente nesta identificação. Técnicas de PLN lidam com problemas relacionados à automação da interpretação e da geração da língua humana em aplicações como Tradução Automática, Sumarização Textos, Ferramentas de Auxílio à Escrita, Perguntas e Respostas, Categorização Textual, Recuperação e Extração de Informação, entre muitas outras (Santana; Magalhães, 2024).  Ademais, existe uma lacuna na literatura, principalmente nas pesquisas sobre a identificação dos EA dos estudantes de engenharia e áreas afins que são escassas. Partindo desta premissa, surge a necessidade de investigar se a identificação e personalização dos EA dos estudantes de engenharia é melhorada através do uso de Processamento de Linguagem Natural. Nesse sentido, o objetivo principal desta pesquisa é propor um modelo de identificação de Estilos de Aprendizagem dos estudantes de engenharia através de técnicas de PLN alinhado ao modelo de Felder E Silverman (1988). Para alcançar este objetivo propõe-se uma metodologia estruturada em seis etapas: aplicação da RSL, que mostrará o estado da arte atualmente e terá os resultados que poderão encaminhar a pesquisa; construção da base de dados, que será feita através das respostas descritivas de questionário adaptado de Felder e Silverman para a identificação dos EA dos alunos que responderam. Pré-processamento da base de dados, que se trata de realizar o tratamento das informações obtidas através dos questionários, utilizando técnicas de PLN, como Stopwors, Lematização e outras que forem necessárias; na parte do treinamento do modelo, serão utilizadas técnicas de PLN para categorizar e identificar os EA dos alunos através do texto respondido no questionário, a priori, serão utilizados modelos que tem melhores resultados com a avaliação de textos em português, como Neive Bayers, LSTM, Random Forest, CatBoost e outros a serem testados; a validação experimental será feita após a construção do modelo, onde a partir dos resultados serão aplicados conteúdos adaptados a cada EA dos alunos; e Resultados, que trarão a análise do modelo e da aplicação da validação em sala de aula. No momento da escrita deste resumo, esta pesquisa encontra-se em fase de andamento, na parte de construção do modelo para identificação dos EA. A base utilizada para os primeiros testes consta com 110 respostas, como  objetivo de alcançar um número maior para o melhor balanceamento dos resultados do modelo proposto. No pré-processamento dos textos, foram utilizadas técnicas como “preprocess_text’(text)” para limpeza dos dados, que converte o texto para minúsculas, remove pontuações e elimina as "stop words" (palavras comuns que não agregam muito significado, como "e", "o", "a") em português. Após a limpeza inicial, os textos passam por “tokenização” (divididos em palavras) e um modelo Word2Vec pré-treinado. O objetivo é calcular o vetor médio para cada texto, representando-o numericamente com base nos vetores das suas palavras. Na função principal do modelo, os dados foram divididos em: 20% para teste e 80% para treinamento. Uma coluna 'label” foi criada através de função, para definir a classe de cada amostra, criando um rótulo binário. Esta classe é determinada pela comparação dos valores médios das colunas 'RAD' e 'RBD'. Inicialmente para os primeiros testes, o modelo fornece uma estrutura abrangente para comparar o desempenho de diferentes abordagens de classificação de texto utilizando o TfidfVectorizer para converter os dados de texto em características numéricas usando a técnica TF-IDF (Term Frequency-Inverse Document Frequency) versus Word2Vec, combinadas com distintos classificadores (Random Forest versus CatBoost) no seu conjunto de dados. Foram utilizadas as técnicas mais comuns para avaliação quantitativa do desempenho do modelo: acurácia, precisão, recall e F1-score. Os resultados iniciais da combinação dos modelos mostram que nos destes de TF-IDF + Random Forest, temos: Acurácia (0.682), Precisão (0.333), Revocação (0.167), F1-Score (0.222). Em TF-IDF + CatBoost: Acurácia (0.636), Precisão (0.250), Revocação (0.167), F1-Score (0.200). Na combinação de Word2Vec + RF:  Acurácia (0.773), Precisão (0.667), Revocação (0.333), F1-Score (0.444). E por fim Word2Vec + CatBoost:  Acurácia (0.773), Precisão (0.667), Revocação (0.333), F1-Score (0.444). Como podemos observar nos resultados iniciais, as combinações que obtiveram os melhores desempenhos nos resultados da acurácia foram Word2Vec + RF e Word2Vec + CatBoost, com o mesmo resultado. É importante salientar que fatores como tamanho da base, modelos para treino e teste e outras combinações de técnicas podem melhorar o desempenho dos resultados. Parcialmente, podemos analisar que os resultados precisam ser melhorados, mesmo contendo um bom desempenho, melhorias precisam ser realizadas e mais testes devem ser feitos. Espera-se que os resultados desta pesquisa possibilitem a validação do Processamento de Linguagem Natural (PLN) como ferramenta para personalização do ensino, permitindo a identificação automática dos estilos de aprendizagem dos alunos das Engenharias. A implementação do modelo proposto tem o potencial de melhorar o aprendizado por meio de um ensino adaptativo, possibilitando que os estudantes recebam materiais e metodologias de ensino alinhados às suas preferências cognitivas. Além disso, a abordagem desenvolvida pode ser expandida para outras áreas e cursos, garantindo maior flexibilidade na aplicação do modelo em diferentes contextos educacionais. A pesquisa também abre caminhos para futuras inovações, como o uso de IA generativa para otimizar recomendações educacionais, tornando o sistema ainda mais dinâmico e personalizado.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas