Modelos Híbridos para Previsão em Séries Temporais: uma Aplicação para a Taxa de Desemprego do Reino Unido

##plugins.themes.bootstrap3.article.main##

Jean Felipe Coelho Ferreira
André Luiz da Silva Xavier
Bruno José Torres Fernandes

Resumo

O comportamento da taxa de desemprego tem sido objeto de interesse dos agentes econômicos: governos, bancos centrais, famílias, empresários e investidores (BLANCHARD, 2011). Isto porque, o desemprego impacta na capacidade de pagamento, reduz a quantidade demandada dos bens e serviços, e altera o desenvolvimento da produção. Para Annable (2007), a modelagem computacional é eficiente para ajustar a previsão da taxa mensal dos salários, o que se configura em uma abordagem moderna para o planejamento econômico. Alguns trabalhos como o de Boylan (2009) e Lashkary (2019) indicam que os modelos híbridos, de aprendizagem de máquina, em séries temporais, são eficientes na mitigação dos ruídos e possuem uma melhor acurácia em comparação aos modelos econométricos tradicionais aplicados as séries macroeconômicas como: desemprego, inflação, crescimento econômico e taxa de câmbio. Estudos recentes como o de de Oliveira (2016) e Chakraborty (2020), indicam um modelo híbrido com um desempenho superior aos modelos individuais, com enfoque na modelagem dos resíduos. A estatística de erros é utilizada para análise comparativa dos modelos, podendo ser aprofundado em Brockwell & Davis (2016). Uma das formas de verificar acurácia dos modelos de previsão propostos, neste estudo, é através da análise estatística de erros, utilizando as métricas: (a) Erro Absoluto Médio (MAE), que representa a média da diferença absoluta entre os valores reais e previstos no conjunto de dados, MAE mede a média dos resíduos no conjunto de dados; (b) Raiz do Erro Quadrático Médio (RMSE) que mede o desvio padrão dos resíduos; e (c) Erro Absoluto Percentual Médio (MAPE) que é semelhante ao MAE, com a diferença, que calcula o erro em termos de porcentagem, e não em valor bruto. Portanto, o MAPE é independente da escala das variáveis. Nesse sentido, visando uma melhor modelagem computacional para manutenção nas previsões da taxa de desemprego, este trabalho tem por objetivo geral realizar uma análise comparativa entre os modelos lineares, não-lineares e híbridos para demonstrar qual modelo melhor se adapta ao problema de predição da taxa de desemprego, atuando em um conjunto de dados com duas das principais variáveis econômicas do Reino Unido, de janeiro de 1997, até março de 2021, retirados do instituto nacional de estatística (ONS - Office for National Statistics). A metodologia deste trabalho foi implementada em quatro etapas: 1. Revisão da literatura para encontrar bases de dados de variáveis macroeconômicas do Reino Unido (taxa de desemprego e inflação) ; 2. Estimar a taxa de desemprego utilizando o modelo ARIMA; 2. Estimar a taxa de desemprego utilizando o modelo ARIMAX com a variável exógena sendo a inflação; 3. Desenvolver modelos híbridos para previsão da inflação. ; 4. Aplicar as métricas: MAE, RMSE e MAPE para avaliação dos modelos; Os dados encontrados foram modelados em séries temporais, conseguindo assim aplicar o modelo ARIMA na série original do desemprego e o ARIMAX com a variável exógena inflação. Após isso, foi possível utilizar um modelo híbrido, calculando os resíduos do erro das previsões ARIMA, e com esses resultados utilizar uma rede neural MLP (Perceptron Multi-camadas) para otimizar esses resíduos a fim diminuir a diferença entre as previsões e resultados reais. Além desses, também foi possível utilizar um modelo não-linear SVR (Máquinas de Vetores de Suporte) associado ao ARIMA (ARIMA+SVR). Os resultados demonstram que modelos híbridos tendem a ser mais adaptativos e conseguem capturar o comportamento da série temporal do desemprego, quando comparados aos modelos lineares tradicionais. Isso pode ser observado em algumas métricas, dentre os resultados dos experimentos, o modelo híbrido proposto ARIMA+SVR teve como RMSE: 0.09, enquanto o ARIMA: 1.56 e o ARIMAX: 0.31, que revela uma menor penalização de resíduos altos. Ao analisar o desempenho dos modelos com o MAPE, foi observado que o modelo proposto ARIMA+MLP obteve o MAPE: 9.30 enquanto que o MAPE no ARIMA: 26.07 e ARIMAX: 6.34, que indica o quanto o modelo está errando em porcentagem. Uma extensão futura deste trabalho está em ampliar o escopo para aplicação do modelo para conjuntos de dados de taxa de desemprego sazonal, adicionar novos atributos (variáveis exógenas) ao modelo, além de contemplar de aprendizagem profunda como redes neurais convolucionais e redes neurais recorrentes (LSTM – Long Short-Term Memory) memória de curto e longo prazo.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas