Aplicação de Algoritmos Bio-inspirados no Aprimoramento de Modelos de Prevenção à Fraude

##plugins.themes.bootstrap3.article.main##

Caio Emanoel Serpa Lopes
Domingos Santos
Roberta Fagundes

Resumo

A detecção de fraudes é um tema de grande relevância, com impacto direto nos sistemas financeiros e econômicos mundiais (BANCO CENTRAL DO BRASIL, 2025). A construção de modelos preditivos com alta precisão na detecção de anomalias e na identificação de fatores otimizadores de desempenho é de suma importância. Este problema representa um desafio considerável, com repercussões adversas para as instituições financeiras, que se manifestam em consequências financeiras, econômicas e éticas, influenciando as políticas corporativas e governamentais. O aprimoramento de modelos capazes de realizar a classificação precisa de fraudes visa à obtenção de resultados superiores. Desse modo, a utilização de métodos que otimizem a adequação das informações para um maior ganho informacional é crucial para a aplicação desses algoritmos, tanto para elevar a qualidade dos resultados quanto para um entendimento aprofundado da natureza dos dados. Em um panorama orientado por dados, a utilização do processo de mineração e suas ferramentas, como softwares e algoritmos de aprendizado de máquina, permite identificar elementos críticos que impactam o resultado final (GUPTA; MEHTA, 2024). A implementação de algoritmos de aprendizado de máquina surge como solução eficaz para discernir padrões e possibilitar a classificação precisa, atingindo o objetivo de prever ocorrências fraudulentas (HERNANDEZ AROS et al., 2024). Isso corrobora a relevância da aplicação desses algoritmos na detecção de fraudes financeiras. O presente estudo objetiva aplicar computação evolucionária e algoritmos bioinspirados para aprimorar a classificação de casos raros, como fraudes, visando maior precisão e capacidade de generalização, com base no conjunto de dados "Credit Card Fraud Detection" (DAL POZZOLO et al., 2014). A comparação de diferentes algoritmos e técnicas de seleção de características é fundamental, visto que a performance de cada modelo tende a variar conforme as métricas e suas particularidades. O desempenho pode apresentar flutuações dependendo do contexto, das características dos dados ou da metodologia de avaliação. Este estudo ressalta a importância da seleção apropriada de características e algoritmos para melhorar o desempenho na classificação de casos anômalos. A análise comparativa foi feita com quatro algoritmos de aprendizado supervisionado — Light Gradient Boosting Machine (LGBM), Extreme Gradient Boosting (XGBoost), Random Forest (RF) e Regressão Logística — na base de dados da Universidade de Bruxelas. A avaliação incluiu otimização de hiperparâmetros com três técnicas bio-inspiradas. O conjunto de dados, com mais de 280 mil transações anonimizadas e aproximadamente 1% de fraudes, caracteriza um cenário de desbalanceamento de classes. Para a otimização dos hiperparâmetros, foram usados três algoritmos bio-inspirados: Algoritmos Genéticos (GA), Particle Swarm Optimization (PSO) e Grey Wolf Optimizer (GWO) (TAYEBI; EL KAFHALI, 2024). Cada otimizador explorou o espaço de busca definido para os parâmetros dos modelos, considerando variáveis como número de estimadores, taxa de aprendizado, profundidade das árvores e penalidades da regressão logística. As métricas utilizadas incluíram F1-score, AUC, precisão e sensibilidade. Entre os resultados, o LGBM otimizado com PSO demonstrou melhor desempenho, com F1-score de 0,74, AUC de 0,97, sensibilidade de 0,80, indicando potencial para aplicações em tempo real. O XGBoost, otimizado com PSO e GA, apresentou desempenho consistente, com F1-score entre 0,57 e 0,79 e AUC entre 0,94 e 0,96. A RF exibiu robustez com F1-score de 0,79 e AUC de 0,94, embora com tempo de treinamento mais elevado, o que pode limitar sua aplicação em cenários de alta demanda. A Regressão Logística, mesmo com AUC de 0,97 e recall de 0,91, teve F1-score de 0,09 devido à baixa precisão (0,05), revelando dificuldades em distinguir fraudes reais de falsos positivos. Em comparação ao estudo “Credit Card Fraud Detection: A Hybrid of PSO and K-Means Clustering Unsupervised Approach” (2023), que obteve acurácia de 73,17% e F1-score de 63,33% com PSO e K-means ponderado, a metodologia deste trabalho demonstrou desempenho superior. O modelo LGBM otimizado com PSO atingiu F1-score de 0,74, AUC de 0,97 e sensibilidade de 0,80. Diferentemente da abordagem não supervisionada do estudo citado, este aplica algoritmos supervisionados otimizados por técnicas bio-inspiradas, proporcionando maior precisão, controle e aplicabilidade prática na detecção de fraudes. Os resultados reforçam a efetividade desses algoritmos na melhoria do desempenho dos modelos. As otimizações alcançadas sugerem um potencial significativo na mitigação de fraudes nos setores financeiro e econômico. Destacam-se três vantagens principais: Otimização de Hiperparâmetros — esses métodos ajustam os modelos para desempenho superior, superando a otimização manual ou por grade; Robustez — ao simular processos naturais de adaptação, ajudam os modelos a lidarem com ruídos e variações nos dados; e Tratamento de Desbalanceamento de Classes — já que fraudes são eventos raros, o estudo enfatiza a relevância da aplicação de técnicas de aprendizado de máquina para a classificação precisa.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas