Rastreador ocular utilizando webcam convencional para comunicação de pessoas com Esclerose Lateral Amiotrófica

##plugins.themes.bootstrap3.article.main##

Nathália Regina Cauás da Silva

Resumo

A Esclerose Lateral Amiotrófica (ELA), caracteriza-se, segundo Junior (2013), pela degeneração progressiva de neurônios motores localizados no cérebro e na medula espinhal. Os principais sintomas apresentados por pessoas com ELA são fraqueza e atrofia muscular, apresentam também dificuldade de fala ou espasmo das cordas vocais. Visando melhor qualidade de vida das pessoas com a doença, soluções de comunicação alternativa têm sido propostas. Venugopal et al. (2016) demonstraram que o Eye Tribe, é capaz de rastrear a posição dos olhos, e usá-la para controlar diversas aplicações no computador. Kaushik et al. (2018) criou óculos capaz de controlar mouses usando os olhos. Wankhede e Pednekar (2019) propuseram uma solução capaz de controlar tablets com movimento ocular. A Tobii® fábrica mouses ópticos com alta eficiência. Entretanto as soluções apresentadas tornam necessário a aquisição de outros dispositivos além de um computador ou smartphone, o que eleva o custo da solução. Este trabalho tem por objetivo geral criar um sistema de comunicação alternativa de baixo custo, usando apenas uma webcam comum, para pacientes com Esclerose Lateral Amiotrófica (ELA). O sistema proposto será eficiente ao estimar corretamente a direção dos olhos do usuário, tornando-o capaz de operar o software sem ajuda de terceiros. A metodologia deste trabalho foi implementada em seis etapas: 1.Revisão sistemática da literatura para encontrar bases de dados de imagens que contenham os olhos em diferentes posições; 2.Construção de base de dados para treinamento e avaliação dos algoritmos; 3.Revisão sistemática da literatura para encontrar arquiteturas de aprendizado profundo aplicadas a rastreamento ocular; 4.Implementação do modelo de aprendizado profundo para estimar a posição dos olhos; 5.Identificação das necessidades básicas dos pacientes; 6.Criação da interface gráfica e junção com o modelo proposto. Com os dados encontrados foi construída uma nova base de dados. Os vídeos dessa nova base variam de posição e qualidade da câmera, iluminação e diversidade étnica. Foi construído um modelo de aprendizado profundo capaz de informar a direção do olhar do usuário em relação a ícones no software proposto. Os resultados preliminares mostram que, o modelo construído foi capaz de classificar a posição do olhar em quatro direções: cima, baixo, esquerda e direita. Atingindo para essas classes a acurácia de 86,7% e índice kappa de 0.80. Considerando estes resultados, pode-se concluir que é possível estimar a posição dos olhos nas classes definidas.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas