Uma arquitetura para análise de sinais biomédicos para apoio ao diagnóstico do transtorno do espectro autista

##plugins.themes.bootstrap3.article.main##

Flavio Secco Fonseca
Wellington Pinheiro dos Santos

Resumo

O Transtorno do Espectro do Autismo (TEA) é uma condição de neurodesenvolvimento que afeta a comunicação social, a interação social e envolve comportamentos repetitivos (DSM-5, 2013). Reconhecido como um espectro com diversas manifestações, o TEA tem impactos duradouros nos indivíduos diagnosticados, suas famílias e nos serviços de apoio e tratamento, de acordo com Lord et al. (2018). Em 2019, essa condição teve um número significativo de novos casos em todo o mundo, com aproximadamente 60,38 milhões de registros. Além disso, estima-se que existiam cerca de 283,25 milhões de casos já diagnosticados até então (Kulage et al., 2020). Os sintomas do TEA aparecem geralmente entre 12 e 24 meses de idade, e a intervenção precoce, antes dos 2 anos, pode melhorar significativamente o desenvolvimento cerebral (Yoo, 2016). No entanto, o diagnóstico precoce é majoritariamente clínico e nem sempre é assertivo ou oportuno, devido à necessidade de uma equipe multidisciplinar, que inclui profissionais como fonoaudiólogos, psicólogos, pediatras, psiquiatras e terapeutas ocupacionais (Rani; Yadav; Verma, 2023). Diante deste contexto, este trabalho tem como objetivo principal validar uma nova proposta de ferramenta para o diagnóstico diferencial do TEA com a utilização de algoritmos de aprendizado de máquinas junto a sistemas de EEG com número reduzido de eletrodos, ou de baixa densidade. Em segundo plano, também será tratado de uma metodologia própria para o tratamento de sinais faltantes, comuns neste tipo de base de dados. É importante salientar que este experimento faz parte de um projeto mais amplo que visa criar uma plataforma integrada de hardware e software, utilizando modelos de aprendizado de máquina, o objetivo final é apoiar o diagnóstico precoce e promover o desenvolvimento de habilidades de aprendizado e comunicação em crianças autistas, especialmente na primeira infância. Foi utilizado o conjunto de dados Sheffield (Dickinson, Jeste e Milne, 2022), que contém dados de EEG de 56 indivíduos entre 18 e 68 anos. Os sinais foram adquiridos em sessões de 150 segundos com estímulos visuais e em repouso. Os dados foram filtrados para uma amostragem de 512 Hz, com 64 eletrodos e, por fim, os sinais corrompidos foram removidos. Para lidar com os sinais faltantes em algumas amostras, foi empregada a interpolação utilizando o método de Ponderação pelo Inverso da Distância (IDW). Após o processo de interpolação, o software GNU Octave foi empregado para segmentar os dados em janelas e extrair atributos relevantes. Foram extraídos 34 atributos de cada janela, tais como média, variância, desvio padrão, raiz quadrada da média, variação da amplitude média. Considerando o total de 64 eletrodos, obtivemos um total de 2176 atributos importantes extraídos do sinal. Esses atributos demonstraram alta relevância e eficácia em estudos anteriores que abordaram EEG e sinais fisiológicos periféricos. As janelas utilizadas tinham duração de 2 segundos, com uma sobreposição de 0,5 segundos. Posteriormente, foi realizada a seleção dos atributos mais significativos por meio de Busca Evolucionária. Para a classificação, o conjunto de dados foi dividido em treino/validação (80\%) e teste (20\%), em seguida os algoritmos Bayes Net, Naive Bayes, Random Tree, Random Forest e Máquina de Vetor de Suporte foram implementados. Após a seleção de atributos utilizando Busca Evolucionária, o banco de dados original com 2176 atributos foi reduzido para um novo conjunto com 20 atributos distribuídos em 17 eletrodos, considerados os mais significativos para a classificação do problema. Nesta abordagem, a Random Forest alcançou os melhores resultados durante o treinamento e a validação cruzada. Tanto as configurações com 100 e 500 árvores atingiram acurácia, sensibilidade e especificidade acima de 93%. Para ambas, um índice Kappa de 0,87 e uma área sob a curva ROC de 0,98 também foram medidos. Durante o teste, o classificador Random Forest manteve um bom desempenho, alcançando acurácia de 95,44%, ligeiramente superior à obtida na etapa de treinamento e validação. Este comportamento é comum devido ao menor rigor estatístico de uma única rodada. O índice Kappa de 0,91, a sensibilidade de 0,95 e a especificidade de 0,96 também foram maiores em comparação à etapa de treino, com mais repetições. Este teste serviu para reforçar o potencial do modelo quando apresentado com novos dados deste problema. Por fim, pode-se concluir que foram obtidos resultados encorajadores para o progresso do diagnóstico do TEA, reforçando nosso objetivo principal. A contribuição potencial deste estudo para a saúde coletiva também é significativa. Ao desenvolver métodos mais eficientes e acessíveis para o diagnóstico do TEA, podemos facilitar o acesso a intervenções precoces e eficazes, melhorando o prognóstico e a qualidade de vida das pessoas afetadas pelo transtorno. Além disso, a automatização do processo de diagnóstico pode contribuir para a redução do tempo e custo associados ao diagnóstico do TEA, beneficiando tanto os pacientes quanto o sistema de saúde coletiva como um todo.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas