Previsão do IPC (Índice de Preços no Consumidor) utilizando a Abordagem de Aprendizagem de Máquina

##plugins.themes.bootstrap3.article.main##

Jean Felipe Coelho Ferreira
Bruno J. T. Fernandes
André L. S. Xavier

Resumo

O conhecimento sobre a previsão da inflação é fundamental para o desenvolvimento da economia de um determinado país. Um dos os indicadores  utilizados para medir a inflação mensal é  o Índice de Preços no Consumidor (IPC), que não se comporta de forma linear, daí a complexidade de estimar o IPC com uma precisão significativa. Neste sentido, empresas, governos e investidores devem conhecer o comportamento dos preços para minimizar os impactos no poder de compra, nos custos de produção e na rentabilidade dos negócios. Em países como o Reino Unido, o Banco Central e projetistas estão interessados em desenvolver modelos eficazes para melhorar a previsão da inflação (H. Hassani e E. S. Silva, 2018). Na literatura sobre séries cronológicas indica que modelos Autorregressivos de Média Móvel Integrada (ARIMA) baseados em BOX e JENKINS (1976) foram usados para realizar previsões de inflação (G. E. Box et al. 2015). Weng Dongdong (2010) empregou a metodologia tradicional Box-Jenkins para seleção do modelo ARIMA para prever a inflação na China. Modelos lineares como o ARIMA têm sido usados no contexto da previsão de produtos básicos de matéria-prima. Anggraeni et al. (2017) empregaram um modelo ARIMAX para prever os preços das commodities na Indonésia, onde a série temporal é formada por componentes lineares e não lineares. Após o processamento utilizando o modelo linear, o erro é calculado. O erro composto de padrões não lineares da série, é usado como entrada para modelagem usando uma rede neural. Vapnik et al. (1996), propôs o método SVR com o objetivo de adaptar o conceito de Máquinas Vetoriais de Suporte (SVMs) para realizar regressões, amplamente empregado para prever dados de séries temporais (Drucker et al. 1996). Zhang (2003) assumiu que uma série cronológica pode ser decomposta em termos dos seus componentes lineares e não lineares. A relação destes componentes é assumida como sendo linear. Assim, um híbrido modelo de previsão de séries cronológicas, utilizando o ARIMA e ANNs foi proposto. O modelo ARIMA realizou previsões lineares da série, enquanto a ANN modelou padrões não lineares nos residuos. Então, a soma das previsões de cada modelo é realizada, obtendo a previsão final do modelo. Outros modelos não-lineares também se destacaram quando comparados ao arima, Siami-Namini et al. (2018) obteve resultados relevantes utilizando LSTM. A fim de reduzir a dimensionalidade dos dados Song, F. et al. (2010) utiliza do algoritmo Principal Component Analysis, já Venkatesh, B. e J. Anuradha. (2019) propuseram um modelo híbrido utilizando MI-RFE, conseguindo assim um resultado promissor na seleção de recursos. Objetivos: Realizar uma análise comparativa entre modelos implementados de previsão, lineares, não-lineares e híbridos além de seleção de recursos, para demonstrar qual modelo melhor se adapta ao problema de predição da inflação no Reino Unido, atuando em um conjunto de dados com uma das principais variáveis econômicas do Reino Unido, de março de 1997, até março de 2021, retirados do instituto nacional de estatística (ONS - Office for National Statistics). Metodologia: Este trabalho propõe uma abordagem de previsão da taxa de inflação, utilizando de dados mensais da mesma e também de outras variáveis macroeconômicas (taxa do banco, desemprego, produto interno bruto, cotação do dólar, cotação da batata, cotação de energia, cotação do ouro e cotação do petróleo), referentes ao período de: março/1997 a março/2021. Para este fim, será desenvolvido um comitê para seleção de recursos, além de um modelo híbrido de previsão utilizando de Deep Learning, envolvendo Percéptron Multicamadas, Máquinas de Vetores de Suporte e modelos lineares (ARIMA, ARIMAX) e não-lineares (LSTM), para predição, da taxa de inflação, capaz de se aproximar com um menor erro dos que os modelos tradicionais econométricos de séries temporais. Resultados e Conclusões: Em relação a(seleção de variáveis exógenas) os algoritmos utilizados PCA (Principal Component Analysis) e Random Forest indicaram o desemprego como feature de maior relevância para explicar a inflação, variável importante o que reforça a teoria da curva de Philips, onde diz que a inflação está inversamente relacionada com a taxa de desemprego. Além disso, nos trouxeram também taxa de juros do banco, produto interno bruto e cotação do petróleo como variáveis influentes. Os dados relacionados com as séries cronológicas mostram que o ARIMAX-MLP com seleção de recursos e LSTM são os mais promissores pois batem os outros modelos em 2 ou mais métricas importantes e o LSTM teve resultados com menos ruídos mostrando que o modelo não-linear consegue se adaptar bem ao problema da previsão da taxa da inflação. Para trabalhos futuros, recomenda-se a ampliação da base de dados e a aplicação em cenários como o Brasil e EUA.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas