Uso de visão computacional na análise de testes cognitivos

##plugins.themes.bootstrap3.article.main##

Lucas Matheus Rodrigues dos Santos
Rodrigo Melo
Rodrigo de Paula Monteiro
Elisson Lima Gomes da Silva
Paulo Junior

Resumo

Com o aumento na expectativa de vida da população, muitas pessoas passaram a desenvolver algum tipo de demência após os 60 anos e essa é uma das principais causas de dependência na terceira idade segundo a Organização mundial de saúde (OMS, 2019). Por esse motivo, é de suma importância que o diagnostico ocorra o mais cedo possível e possa ser feito em larga escala para atingir o maior número de pessoas possível. Uma das ferramentas utilizadas para o auxílio da formação de decisão de diagnóstico é o Mini-Exame do Estado Mental (MEEM), que é um dos testes cognitivos mais utilizados (YANG et al., 2016). O MEEM é um teste cognitivo que tem várias fases que avaliam as funções cognitivas de uma pessoa. Através do resultado do teste, pode-se ter um indicativo se o paciente está com um declínio cognitivo esperado para a idade, ou se existe um quadro de declínio cognitivo leve (DCL), que pode ser chamado de um estado pré-demência, ou a presença da demência. A última etapa do MEEM é a realização da cópia de um desenho, que consiste em dois pentágonos fazendo com que haja um losango na interseção entre eles. Este trabalho busca propor um modelo de rede neural convolucional (CNN) para automatizar a última etapa do MEEM (cópia do desenho dos pentágonos) e com isso auxiliar a automatização de todo o teste. As CNNs foram escolhidas pois é o método mais utilizado para tarefas de classificação de imagens, seu ótimo resultado se deve à captura de dependências espaciais na extração de características das imagens, incorporada na operação de convolução presente no algoritmo. Diversos experimentos foram conduzidos com o objetivo de alcançar o maior acerto na tarefa de classificação das imagens, para que isso fosse possível, foi desenvolvido uma base de dados com 1258 desenhos dos pentágonos se interceptando, das quais parte delas foram obtidas de artigos da literatura, algumas foram obtidas com o auxílio de voluntários e por último a base de dados foi ampliada utilizando técnicas de data augmentation. No treinamento, foi utilizado 70% do total da base de dados para treinar a rede, sendo desses 70%, 20% para validação de treino. Os outros 30% ficaram para a parte de teste do modelo. O modelo que usamos começa com 8 filtros convolucionais de tamanho 3x3 e Stride 1 seguido de uma camada de pooling Max Pooling tamanho 2x2 e Stride 2, passando por mais 16 filtros convolucionais de tamanho 3x3 e Stride 1, novamente seguido por uma camada de pooling Max Pooling tamanho 2x2 e Stride 2, passando novamente por 32 filtros convolucionais de tamanho 3x3 e Stride 1 sendo seguido por uma camada de pooling Max Pooling tamanho 2x2 e Stride 2. Nas camadas totalmente conectadas foi utilizado uma camada com 50 neurônios seguida de outra com 10 neurônios. Na camada de saída temos apenas dois neurônios que fazem a classificação. Nas camadas convolucionais e nas totalmente conectadas foi usado como função de ativação a função relu, como função otimizadora foi usado adam, como função de perda foi usado crossentropy e como saída usamos a função softmax para fazer a classificação. Nessa configuração, conseguiu-se obter cerca de 96% de acurácia nos dados de testes usando apenas a CNN. Logo, a técnica utilizada se mostrou adequada para a realização da classificação dos desenhos. Como trabalhos futuros, será utilizado o aprendizado multimodal, o qual apresentaremos ao modelo além das imagens da base de dados, seus respectivos espectros de Fourier. Assim, é esperado que haja uma melhora na acurácia do modelo na realização da classificação.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas