Utilização de Técnicas de Aprendizado de Máquina para diagnóstico de Doença de Alzheimer e Déficit Cognitivo Leve

##plugins.themes.bootstrap3.article.main##

Jonathan da Silva Bandeira
Mêuser Valença

Resumo

Nas últimas décadas, tem se observado um aumento significativo na expectativa de vida populacional em detrimento à taxa de natalidade, sobretudo em países em desenvolvimento como o Brasil. E com o aumento da longevidade, surgem maiores desafios e preocupações para com as necessidades dessa parcela idosa da população (LIMA, 2018). Uma destas preocupações é referente à saúde dos idosos, especialmente quanto ao desenvolvimento das chamadas Doenças Crônicas Não-Transmissíveis (DCNT) tais como as demências, dentre as quais se destaca a Doença de Alzheimer (DA), um transtorno neurodegenerativo  progressivo que produz danos irreversíveis ao cérebro de um indivíduo, deteriorando sua capacidade cognitiva e sua memória (capacidade de recordar informações antigas ou aprender informações novas) e comprometendo sua rotina diária e comportamento. A DA já acomete aproximadamente pouco mais de 47 milhões de pessoas no mundo (DALMAGRO et al., 2020). É importante frisar que tal qual outras doenças crônicas, embora seja irreversível, a DA pode ser controlada se diagnosticada em sua fase inicial, de modo a retardar o avanço degenerativo e garantir melhor qualidade de vida para o paciente. Dadas as dificuldades do diagnóstico, os impactos causados pela DA, tanto econômicos, quanto na qualidade de vida da população e no aumento da incidência desta patologia, bem como no grande potencial apresentado pelas soluções no ramo da Inteligência Computacional, o desenvolvimento de novas soluções e avanços nessa linha de pesquisa se provam justificáveis. A abordagem do atual estado-da-arte é baseada em evidências e exames de imagens. Isto ocorre, pois a autópsia cerebral no período post-mortem de cada paciente fornece maiores valores de sensibilidade e especificidade. O principal ponto negativo é que somente nesse período se alcançam esses valores (DALMAGRO et al., 2020). Outra abordagem, antes não muito utilizada, mas que vem ganhando notoriedade recentemente é a abordagem bioquímica e molecular que utiliza de análises de exames laboratoriais para trabalhar com informações advindas da genética biomolecular e de características observadas no plasma sanguíneo, como o nível de concentração de determinadas proteínas. Há diversas hipóteses que descrevem que a presença de determinadas proteínas contribui para o desenvolvimento de DA e outras demências, sendo uma das mais conhecidas a hipótese amiloide (HARDY & HIGGINS, 1992). Baseando-se nessa assertiva, alguns estudos foram desenvolvidos e geraram trabalhos relevantes no diagnóstico computacional de DA e Déficit Cognitivo Leve (DCL) usando uma abordagem bioquímica, tais como Ray et al. (2007) e Ravetti & Moscato (2008). Nestes trabalhos se utilizou uma base de dados consistente de 120 proteínas encontradas no plasma sanguíneo de 222 pacientes, desenvolvida por Ray et al. (2007), que ao longo de suas vidas foram submetidos a exames laboratoriais e que poderiam ser diagnosticados com DA, DCL ou outro tipo de demência ou enfermidade. Esses estudos se mostraram relevantes para diagnosticar com antecedência essas doenças. O presente trabalho, utilizando desta base de dados, teve como principal objetivo realizar a seleção do menor subconjunto de proteínas (assinatura) possível que mantivesse a mesma representatividade que o conjunto total de 120 proteínas e que as melhores assinaturas encontradas nos dois trabalhos citados (18 proteínas em Ray et al. e 5 proteínas em Ravetti & Moscato) no desempenho do diagnóstico dessas doenças, ao mesmo tempo em que se avaliou o custo financeiro dos exames que precisariam ser realizados para aferir as concentrações das proteínas destacadas na assinatura. Para isto, foram geradas assinaturas com 18, 10, 5, 3, 2 e 1 proteínas utilizando o algoritmo conhecido como Recursive Feature Elimination. Além disto, se buscou mensurar o desempenho de cada assinatura de proteínas gerada por meio da realização de uma classificação utilizando um modelo de Redes Neurais Artificiais Multi-Layer Perceptron (RNA MLP) com duas camadas ocultas. O desempenho desse modelo foi avaliado segundo as métricas de acurácia, sensibilidade, especificidade e área abaixo da curva ROC.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas