Estudo de caso empírico do uso de uma Rede Multilayer Perceptron na classificação do risco de crédito.

##plugins.themes.bootstrap3.article.main##

Armando Pereira Pontes Júnior
Roberta Andrade de A. Fagundes

Resumo

Contexto: Instituições financeiras atuam, entre outras atividades, como agentes de intermediação financeira captando recursos juntos aos investidores pessoas físicas, empresas e governos que possuem recursos financeiros excedentes e canalizam àqueles que necessitam de recursos para financiar seus déficits orçamentários ou fazer frente a novos investimentos. Assim, cabe registrar que uma das atividades primordiais das instituições financeiras é intermediar à relação comercial desses agentes (superavitários versus deficitários) de forma rápida e segura. Portanto, de acordo com CENTA (2005), crédito é todo ato de vontade de alguém (pessoa física, empresa ou Governo) em ceder, temporariamente, parte de seu patrimônio a um outro, com expectativa de que essa parcela cedida retorne a sua posse de forma integral, acrescida de juros (remuneração do capital) e no tempo acordado. Segundo HOJI (2010), risco de crédito é, portanto, a probabilidade de que este retorno não se concretize de forma total ou parcial, trazendo prejuízo a pelo menos uma das partes. Motivação: o risco de crédito está presente em todas as fases de uma operação de crédito, desde o momento do cadastro de um pretenso mutuário, passando pelos cálculos dos valores dos limites de crédito até o pagamento da última parcela. Cabe ao gestor financeiro criar ferramentas de mensuração, gerenciamento e acompanhamento de risco que identifiquem com antecedência, e com um certo grau de assertividade, aquelas operações que possam entrar em default (inadimplência). A concessão de crédito é, primordialmente, uma tarefa de classificação e o uso de técnicas de machine learning estão sendo cada vez mais testadas. Um dos motivos para sua ampla utilização é que não se exige o conhecimento das relações entre as variáveis de entrada e saída do modelo. Objetivo: verificar de forma empírica como o uso de modelos de machine learning, como uma rede neural MLP – MultiLayer Percetron poderia ajudar na classificação de risco de crédito financeiro. Metodologia: nesse trabalho foram utilizadas quatro etapas baseado na metodologia CRISP-DM (Cross Industry Process for Data Mining) (WIRTH et al,.2000) para execução do objetivo mencionado, são elas: (i) Descrição do Problema, (ii) Pré-Processamento dos Dados, (iii) Modelagem e (iv) Avaliação dos Resultados. (i) Descrição do Problema: utilizar uma base financeira com 40.320 registros de operações de crédito pessoal realizadas ao longo do ano de 2017 para treinar uma rede neural MLP. As operações de créditos estavam relacionadas a comercialização de três tipos de produtos financeiros:  a) cartão de crédito, b) crédito direto ao consumidor – CDC e c) cheque especial. Cada registro das operações possuía 21 atributos que estavam divididas entre características pessoais do tomador de crédito (data de nascimento, estado civil, sexo, grau de instrução, dependentes e idade), caraterísticas inerentes à atividade profissional exercida ou ao patrimônio do mutuário (setor de atividade, tipo de residência, classe profissional, renda, outras rendas, renda do cônjuge e tempo no emprego), características relacionadas à própria operação de crédito (prazo da proposta, produto financeiro e situação da operação: adimplente ou inadimplente), informações cadastrais de endereço (CEP, UF residencial, DDD residencial e telefone residencial) e uma coluna que trazia os IDs das operações. (ii) Pré-processamento: da forma como a base foi disponibilizada foi necessário retirar, primeiramente, os atributos que estavam relacionados ao endereço dos mutuários. Estas informações servem principalmente para contato entre a cooperativa e o mutuário e não traz muito ganho de informação para o modelo preditivo. Também foram retiradas as colunas que identificavam as operações e a data de nascimento, uma vez que esta informação mostrava-se redundante com a informação do campo idade. O tratamento e a limpeza dos dados continuaram com a criação de um atributo que agregou todas as rendas informadas (atributo nomeado como renda familiar), visto que se tratam de atributos com a mesma característica e informação. Por fim, foram feitas exclusões dos registros faltantes ou que apresentavam algum tipo de incongruência nas suas informações (por exemplo: idade superior a 130 anos ou com valores negativos ou ainda, o atributo tempo de serviço com valores superiores a própria idade do mutuário). (iii) Modelagem: que inicia com o treinamento da rede através do pré-processamento finalizado, a base passou a ter 28.700 registros e 12 atributos. Para a fase de treinamento da rede neural foram feitas as normalizações dos valores de todos os atributos. Utilizou-se da seguinte fórmula: Y = (X / Xmax), onde o Y é o valor resultante da normalização (valor dentro do intervalo de 0 e 1); X é o valor para cada linha do atributo (ou seja, cada instância) e Xmax é o maior valor observado para atributo que está sendo normalizado. A rede MLP foi arquitetada com uma camada de entrada com 11 neurônios (um neurônio para cada input), uma camada intermediária (hidden layer) com 64 neurônios e uma camada de saída com 2 neurônios, onde apenas um é ativado, a depender de como a rede classificará a operação em adimplente ou inadimplente. O conjunto de dados foi subdividido em três grupos: um chamado de conjunto de treino, com 64% dos registros (18.368), um conjunto chamado de validação, com 16% dos registros (4.592) e o último, chamado de conjunto de teste, com 20% dos dados (5.740). Para encontrar a melhor configuração, aquela que apresentasse o maior valor de acurácia, diversas combinações de parâmetros foram simulados na rede MLP, sendo que a configuração que apresentou o melhor resultado foi: Função de ativação (Sigmóide logística); Neurônios da camada de entrada (11); Neurônios da camada escondida(64); Neurônios na camada de saída(2); Taxa de aprendizagem (0.1); Dropout (0.2); Épocas (30) e Algoritmo de aprendizado (backpropagation). (iv) Avaliação dos Resultados: os valores obtidos para as acurácias do conjunto de treino, do conjunto de validação e do conjunto de teste foram 65,01%, 64,85% e 64,34%, respectivamente. Os resultados encontrados ficaram abaixo dos resultados observados no artigo Jae Young Seo (2020), que fez um estudo comparativo com vários classificadores de machine learning para o problema de avaliação do risco de crédito. Conclusão: O trabalho demostrou a importância e o poder de generalização de uma rede neural MLP para o desafiante problema de classificação de risco de crédito. Mesmo utilizando uma configuração básica de uma rede neural é possível obter predições satisfatórias que podem auxiliar o gestor financeiro a avaliar melhor sua carteira de clientes e diminuir a inadimplência. Trabalhos Futuros: proposição outros modelos de machine learning e realização do teste de hipótese para ratificar as diferenças significativas entre os modelos.
 
Palavras-chaves: Aprendizagem de Máquina; Redes Neurais; Risco de Crédito.  

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas