Uma abordagem baseada em Isolation Forest para detecção robusta de anomalias em máquinas industriais usando Out-of-Distribution

##plugins.themes.bootstrap3.article.main##

Cristofer Gabriel Santos da Silva
João Campos
Leonardo Bortoni
Pablo Jaskowiak
Diego Pinheiro

Resumo

A indústria tem acumulado prejuízos econômicos, exposto seus funcionários a riscos à saúde e gerado problemas ambientais causados por falhas e mau funcionamento de máquinas industriais (Chinniah, 2015). Diante desses desafios, modelos de aprendizado de máquina vêm sendo explorados na manutenção preditiva de máquinas industriais, detectando antecipadamente anomalias em seu funcionamento a partir de dados coletados por sensores. Trabalhos recentes mostram que manifestações acústicas tendem a ser os primeiros indícios de falhas e, quando comparados com dados de outros sensores, como de vibração e de temperatura, sensores acústicos podem permitir detecção de anomalias mais antecipadamente. A alta dimensionalidade de dados acústicos, contudo, pode tornar a detecção de anomalias mais desafiadora, incentivando o desenvolvimento de abordagens complexas, com baixa replicabilidade, menor explicabilidade e pouca robustez, especialmente quando avaliadas em cenários distintos daqueles nos quais foram treinadas (i.e., out-of-distribution). Neste trabalho, desenvolvemos a abordagem iMFCCForest para a detecção de anomalias não supervisionada que utiliza dados acústicos de máquinas industriais e consiste em um modelo simples, Isolation Forest (Liu; Ting; Zhou, 2008), equipado com uma extração de características baseada em MFCC (mel-frequency cepstral coefficients) (Abdul; Al-Talabani, 2020). Incluímos a abordagem iMFCCForest no framework MTSA para garantir replicabilidade (Silva et al., 2024) e a comparamos com abordagens mais complexas baseadas em aprendizado profundo tanto em cenários in-distribution quanto out-of-distribution. As abordagens baseadas em aprendizado profundo existentes no MTSA e consideradas para a detecção de anomalias foram GANF, RanSynCorders e Hitachi pois incluem modelos recorrentes, baseados em grafos e generativos, possibilitando uma diversidade de arquiteturas para comparação. O conjunto de dados utilizado foi o MIMII (Purohit et al., 2019), que contém dados acústicos normais e anômalos de quatro tipos diferentes de máquinas industriais (válvulas, bombas, trilhos deslizantes e ventiladores), contendo diferentes subtipos para cada tipo de máquina. Para possibilitar o aprendizado não supervisionado, o conjunto de teste conteve todos os dados anômalos e uma mesma quantidade de dados normais, enquanto o conjunto de treino conteve  apenas dados normais. O desempenho das abordagens foi avaliado utilizando a métrica AUC-ROC e o uso da estratégia de K-fold com 5 folds. No cenário in-distribution, para cada tipo de máquina, os modelos foram treinados e testados em máquinas de mesmos subtipos. No cenário out-of-distribution, os modelos foram testados subtipos diferentes dos quais foram treinados. Nossos resultados mostram que, no cenário in-distribution, comparada às outras abordagens, a abordagem  iMFCCForest apresentou AUC-ROC superior para todos os tipos de máquinas, com exceção da abordagem RANSynCoders para os ventiladores. No cenário out-of-distribution, a iMFCCForest se mostrou mais robusta à mudança da distribuição dos dados quando comparada às abordagens baseadas em aprendizado profundo. Esses resultados mostram que modelos mais simples, quando combinados com extração de características baseadas em processamento de sinais, podem alcançar resultados superiores em cenários in-distribution e mais robustos em cenários out-of-distribution. Apesar da popularidade do aprendizado profundo devido a sua conveniente capacidade de extrair características automaticamente a partir dos dados, abordagens mais simples têm sido incrementalmente negligenciadas. Nosso trabalho mostra que o desenvolvimento de abordagens que combinam modelos simples com extração de características baseadas em processamento de sinais, possibilita a construção de abordagens mais explicáveis, robustas e eficientes, destacando o valor de abordagens mais simples na detecção de anomalias em máquinas industriais.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas