Análises de comportamento usando Visão Computacional para detecção de riscos

##plugins.themes.bootstrap3.article.main##

Letícia Portela
Bruno José Torres Fernandes

Resumo

A identificação de riscos à saúde humana com Visão Computacional é uma área de pesquisa que está crescendo em relevância, como visto em Angela et al. (2012) e Waqas et al. (2018). Há diversos possíveis riscos a serem detectados, como quedas, afogamentos e convulsões, explorados nos trabalhos de Yves et al. (2017), Anthony et al. (2021) e David et al., respectivamente. A detecção automatizada de tais situações pode permitir a redução de custos e uma maior eficiência no reconhecimento do risco, possibilitando que sejam acionados serviços de emergência e evitando complicações maiores por demora de atendimento. Afinal, como evidenciado por Peter et al. (2005), um menor tempo de resposta diminui o risco de complicações dos pacientes. Dessa forma, o projeto propõe um modelo de Visão Computacional o qual classifica vídeos como riscos à saúde ou atividades normais. Para montá-lo, foi feita uma revisão sistemática da literatura, objetivando identificar o estado da arte de reconhecimento de ações. Além disso, foi feita uma revisão sistemática da literatura de bases de dados, para selecionar vídeos que contenham ações relevantes para o problema em questão. O modelo proposto extraí características de vídeos utilizando a Spatial Temporal Graph Convolutional Network (ST-GCN), criada por Sijie et al. (2018), pré-treinada com a base Kinetics, de João et al. (2017). Essas características são então classificadas utilizando Decomposição de Valor Singular (SVD), com uma abordagem de detecção de anomalias, uma vez que há maior volume de vídeos de atividades normais que de riscos à saúde. O SVD é treinado na reconstrução de situações normais, e apresenta maior erro na reconstrução de situações de risco. Portanto, o erro de reconstrução é utilizado para classificar os vídeos, a partir de um limiar que melhor os separe. A abordagem proposta foi testada em reconhecimento de quedas e de afogamentos. Em reconhecimento de quedas, com as bases de dados UR-Fall, Up-Fall e Precis Har, foram obtidas acurácias de, respectivamente, 100%, 98,62% e 94,94%. Já na identificação de afogamento, foi obtida, na base de dados LifeGuard.IO, 38% de acurácia. A partir desses resultados pode-se concluir que o modelo é capaz de identificar quedas corretamente, porém encontra dificuldades em identificar afogamentos. Logo, futuramente espera-se que o modelo seja aprimorado para detecção de afogamento, e ampliado para outras situações de risco. Dessa forma, ele poderá ser utilizado em ambientes de saúde ou mesmo residências para melhorar o tempo de resposta a acidentes e diminuir custos. Ademais, o projeto agrega conhecimento de ponta no que tange a aplicações de Visão Computacional ao grupo de pesquisa de Reconhecimento de Padrões e Processamento de Imagens.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas