Aplicação de Sistemas Inteligentes Híbridos para Modelagem do Índice Nacional de Preços ao Consumidor Amplo (IPCA)

##plugins.themes.bootstrap3.article.main##

ANDRE LUIZ DA SILVA XAVIER
Bruno J. T. Fernandes
Joao F. L. de Oliveira

Resumo

Aplicação de Sistemas Inteligentes Híbridos para Modelagem do Índice Nacional de Preços ao Consumidor Amplo (IPCA) 
As flutuações dos níveis de preços na economia têm impactos em diversos setores, com efeitos no poder de compra, lucro das empresas, taxas de juros, desemprego, investimentos e equilíbrio entre as transações comerciais nacionais e internacionais. Para Cavalcanti e Jalles (2013), as técnicas de previsão confiáveis contribuem na formulação de políticas macroeconômicas adequadas para o desenvolvimento econômico. Os estudos de Juntilla (2001) e Torbat et al (2018), sobre previsão da inflação e mercados econômicos, indicam que os modelos autorregressivos integrados de média móvel (ARIMA) conseguem captar o movimento das séries de preços ao longo do tempo. No entanto, no mundo real, os índices de preços, a exemplo do Índice Nacional de Preços ao Consumidor Amplo (IPCA) não se comportam de forma essencialmente linear, sendo necessário a construção de algoritmos que consigam lidar com padrões lineares e não lineares, a exemplo dos sistemas híbridos (ZHANG, 2003). Estes sistemas combinam a modelagem linear e não linear de uma série temporal em três etapas: 1. Previsão da Série; 2. Previsão da Série Residual; 3. Combinação das Previsões (BABU e REDDY, 2014). Na literatura, estudos como os de Pai e Lin (2005), recomendam um modelo híbrido ARIMA (previsão linear) e Support Vector Regression (SVR) na previsão dos resíduos, combinando em ARIMA+SVR para realizar a previsão dos preços das ações. Alguns estudos, recentes, têm sido desenvolvidos relatando o desempenho dos sistemas híbridos, com “ênfase” na previsão dos resíduos, propondo técnicas estatísticas e de aprendizado de máquina (ML) para modelagem residual (erros) das previsões (OLIVEIRA et al, 2021).  Em meio a esse cenário, os principais objetivos deste trabalho são: (a) propor um modelo híbrido inteligente para previsão do IPCA, considerando variáveis exógenas tais como: desemprego, taxa de câmbio, inflação e taxa SELIC; (b) implementar um algoritmo de Regressão Linear para modelagem dos preços utilizando o desemprego como variável explicativa e (c) realizar uma análise de desempenho dos modelos de previsão por meio das métricas: Erro Absoluto Percentual Médio (MAPE) e Erro Quadrático Médio (MSE). O modelo utilizado, neste trabalho, é um método sequencial composto por três etapas: previsões lineares, modelagem dos resíduos e combinação. Como sugerido por Hyndman e Athanasopoulos (2018), o critério de informação de Akaike (AIC) pode ser utilizado para verificar o desempenho dos modelos lineares ARIMA e ARIMAX (variável exógena: desemprego). Para modelagem da componente não linear, foi implementado uma rede neural, Multilayer Perceptron (MLP), utilizando a metodologia da busca em grade (Grid Search) onde os melhores hiperparâmetros selecionadas foram: input(lag): 2, 5, 10, 15, 20; a função de ativação foi a sigmoide e o número de neurônios da camada escondida: 2, 5, 10, 15, 20. Além da MLP, os resíduos foram modelados utilizando o SVR, com função de Kernel: RBF, gama (γ): 1, 0.1, 0.01, 0.001 e custo (c): 0.1, 1, 100, 1000, 10000. A base de dados contém 291 registros, com frequência mensal, compreendendo o período de janeiro/1997 a março/2021. Para o IPCA, os dados foram do Instituto Brasileiro de Geografia e Estatística (IBGE), enquanto os da taxa de desemprego do Instituto de Pesquisa Econômica Aplicada (IPEA). A divisão da base de dados foi processada em: 60% para treinamento dos modelos, 20% validação e 20% (teste). Dos resultados dos modelos, inicialmente foi observado a métrica do MSE. A métrica do MSE é sensível à escala dos dados e penaliza as maiores diferenças entre as predições e os valores reais. Utilizando o MSE, observou-se que o modelo proposto (ARIMA+MLP), apresentou o melhor desempenho comparado aos modelos ARIMA, SVR, Regressão Linear e ARIMA+SVR. O MSE do modelo proposto foi igual a 0,0305. Enquanto o ARIMA 0,1005; o SVR foi de 0,0774; ARIMA+SVR igual a 0,0910 e o pior desempenho foi o da Regressão Linear com o MSE sendo 0,1316. Assim como o MSE, quanto menor o valor do MAPE, melhor a avaliação de acurácia do modelo. Ao analisar a performance através do MAPE observa-se o melhor resultado no modelo ARIMA+SVR = 60,5379; seguido por SVR = 65,9863, o proposto ARIMA+MLP = 72,7239, o ARIMA = 76,2862 e, por último, a Regressão Linear = 177,2975. Por fim, o estudo indicou que os sistemas híbridos possuem um desempenho superior aos modelos ARIMA e Regressão Linear. Uma das aplicações práticas do modelo implementado ARIMA+MLP está na calibração mais eficiente da inflação no Brasil, em comparação aos modelos autoregressivos. Para trabalhos futuros, a recomendação é a inserção de novas variáveis: Produto Interno Bruto – PIB e cotação dos preços de commodities, para verificar o desempenho das predições. Além disso, serão utilizados novos modelos para comparação, incluindo a arquitetura de redes neurais Long Short Term Memory (LSTM).
 
Palavras-chave: Aprendizado de Máquina, Sistemas Híbridos; Inflação; Séries Temporais.
 
Referências 
BABU, C.N., REDDY, B.E. A moving-average filter based hybrid ARIMA-ANN model for forecasting time series data. Appl. Soft Comput. 23, 27–38, 2014.
CAVALCANTI, T; JALLES, J. T. Macroeconomic effects of oil price shocks in brazil and in the united states. Applied Energy, vol. 104, pp. 475–486, 2013.
HYNDMAN, R. J. and ATHANASOPOULOS G. Forecasting: principles and practice. OTexts, 2018.
JUNTTILA, J. Structural breaks, arima model and finnish inflation forecasts. International Journal of Forecasting, vol. 17, no. 2, pp. 203–230, 2001. 
OLIVEIRA, J. F. L; SILVA, E. G.and MATTOS NETO, P. S. G. A hybrid system based on dynamic selection for time series forecasting. IEEE Transactions on Neural Networks and Learning Systems, pp. 1–13, 2021.
PAI, P. F. and LIN, C.S. A hybrid arima and support vector machines model in stock price forecasting. Omega, vol. 33, no. 6, pp. 497–505, 2005.
TORBAT, S; KHASHEI M. and BIJARI. A hybrid probabilistic fuzzy arima model for consumption forecasting in commodity markets. Economic Analysis and Policy, vol. 58, pp. 22–31, 2018.
ZHANG, G. P. Time series forecasting using a hybrid arima and neural network model. Neurocomputing, vol. 50, pp. 159–175, 2003.
 

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas