Análises de comportamento usando Visão Computacional para detecção de quedas
##plugins.themes.bootstrap3.article.main##
Resumo
O reconhecimento de cenas de risco usando imagens é uma área de pesquisa cada vez mais relevante para a área de segurança, como visto em Angela et al. (2012) e Waqas et al. (2018). Alguns trabalhos combinam imagens com sensores, a exemplo de Yves et al. (2017) e Lourdes et al. (2019), ambos focados em deteção de quedas de idosos, e o primeiro voltado especificamente para smart houses. No entanto, abordagens usando apenas câmeras são mais facilmente implementadas em situações reais, com menos custo. Portanto, nesse projeto foi desenvolvido um modelo de rede neural que classifique vídeos como queda ou não queda. Primeiro, foram feitas duas revisões sistemáticas da literatura, para identificar o estado da arte de bases de dados e modelos de reconhecimento de ações. A revisão das bases foi utilizada para selecionar classes relevantes, e a dos modelos para desenvolver a rede que vai ser usada para classificá-las. A partir da segunda revisão, foi proposto um novo modelo, que combina a Spatial Temporal Graph Convolutional Network (ST-GCN), criada por Sijie et al. (2018), com Singular Value Decomposition (SVD). A ST-GCN foi pré-treinada com a base Kinetics, de João et al. (2017), e as features da sua última camada são usadas para treinar o SVD. Nele, é usada uma abordagem de detecção de anomalias, apropriada em situações onde há mais volume de informações para uma classe que para a outra. Como há mais cenas de atividades diárias, o SVD é treinado para reconstruir apenas imagens dessa classe, e por isso é esperado que tenha maior erro na reconstrução de quedas. Dessa forma, o resultado pode ser usado para classificar os vídeos como queda ou não, a partir de um limiar que melhor separe os erros encontrados. O modelo proposto foi testado nas bases de dados UR-Fall, Up-Fall, Precis Har e HMDB51, e obteve acurácias de, respectivamente, 94%, 94,45%, 100% e 81,84%. Os resultados obtidos indicam que a rede é capaz de identificar diferenças entre ações diárias e quedas, sendo então relevante para a solução do problema apresentado. Espera-se que futuramente esse modelo seja ampliado para detectar outras situações de risco, e seja empregado em ambientes de saúde para melhorar o tempo de resposta a acidentes. Ademais, poderão ser criados protótipos funcionais em hardwares com câmaras, como celulares, raspberry e orange pi. Finalmente, o projeto agrega conhecimento de ponta no que tange a aplicações de Visão Computacional ao grupo de pesquisa de Reconhecimento de Padrões e Processamento de Imagens.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Edição
Seção
Engenharia da Computação e Sistemas