Sistemas Híbridos em Série para Previsão um Passo à Frente de Séries Temporais Univariadas

##plugins.themes.bootstrap3.article.main##

Iván Patricio Moreno-Marcos
Patricia Takako Endo
João Fausto Lorenzato de Oliveira

Resumo

Modelos individuais tanto lineares como não lineares para previsão de séries temporais univariadas têm sido aplicados em diferentes domínios com resultados satisfatórios (WANG et al. 2011; JUNIOR et al. 2014). No entanto, esses modelos apresentam algumas limitações, como possibilidade de um maior risco de overfitting quando especificando o modelo e dificuldade de modelar componentes lineares e não lineares de séries temporais. Para contornar algumas das limitações dos modelos individuais, os Sistemas Híbridos em Série (SHS) aparecem como uma alternativa, uma vez que são capazes de modelar os componentes linear e não linear separadamente usando um modelo para cada. Tradicionalmente, os SHS seguem as seguintes etapas: (i) treina-se um modelo usando a série original (clássico linear ou de aprendizagem de máquina não linear) cuja saída é a previsão da série; (ii) treina-se um segundo modelo usando os resíduos (os quais são calculados como a diferença entre a série original e sua previsão) e (iii) usa-se um método de combinação das saídas das etapas (i) e (ii) para se obter o resultado final de previsão do referido sistema (GINZBURG e HORN, 1994; ZHANG, 2003). O overfitting acontece quando um modelo se ajusta muito bem à série de treinamento mas não apresenta um bom desempenho na série de teste (YING, 2019). GINZBURG e HORN, (1994) usam uma Multilayer Perceptron (MLP) na etapa (i) e um Perceptron linear na etapa (ii) assumindo uma relação aditiva na etapa (iii). Desta maneira, eles defendem a premissa que usando a previsão de saída da etapa (ii) para corrigir a previsão de saída da etapa (i) é uma melhor abordagem do que incrementar a complexidade na etapa (i). Consequentemente, pode-se diminuir as chances de overfitting. Na comparação do SHS proposto por GINZBURG e HORN, (1994) com uma rede complexa, obteve-se uma melhoria no desempenho e simplicidade no treinamento (menor número de gradientes a serem calculados para atualizar os pesos da rede neural usando o algoritmo back-propagation of error) quando prevendo séries anuais de manchas solares. Comumente, um único modelo, tanto linear quanto não linear, apresenta dificuldades para modelar séries do mundo real. O trabalho do ZHANG, (2003) propõe um SHS que usa na etapa (i) um modelo Autoregressive Integrated Moving Average (ARIMA); na etapa (ii) uma MLP e uma relação aditiva na etapa (iii). Simulações usando três séries temporais (manchas solares anuais, número anual de linces caçados e taxa de câmbio semanal de libras para dólar) sugerem que o SHS pode obter melhores resultados do que modelos ARIMA e MLP usados de forma individual. Uma única rede neural pode não ser adequada para modelamento linear igualmente bem do que um modelamento não linear por possíveis problemas associados a configuração dos hiperparâmetros da rede e estocasticidade própria no processo de treinamento, resultando em modelos com overfitting ou underfitting. KHASHEI e BIJARI, (2011) propõem usar um modelo ARIMA na etapa (i) e juntar as etapas (ii) e (iii) usando uma MLP cujas entradas seriam a previsão linear, a série original e os resíduos. Isto implica que o MLP teria como entradas a previsão linear e a série original, aumentando assim suas chances de aprendizagem de captura de padrões lineares. Resultados usando séries de manchas solares anuais, número anual de linces caçados e taxa de câmbio semanal de libras para dólar, demonstram que obteve-se melhor desempenho do que a arquitetura do ZHANG, (2003) e de modelos ARIMA e MLP usados de forma individual. Apesar dos SHS terem certo destaque sobre modelos individuais em algumas situações de previsão, existe um problema em aberto a respeito de como melhor combinar as saídas das etapas (i) e (ii). Este problema deve-se basicamente à incerteza associada à seleção do número de valores passados das previsões lineares (etapa (i)) e não lineares (etapa (ii)) para modelagem na etapa (iii). O trabalho DE MATTOS NETO et al. (2017) propõe um método chamado Nonlinear Combination (NoLiC) para um SHS. O NoLiC incorpora um MLP e é usado na etapa (iii) para buscar a melhor função que combine as saídas das etapas (i) e (ii), já que uma rede neural pode ser considerada como um aproximador geral de funções. Usando dados de níveis de concentração de contaminação diária, os resultados de simulação, apontam que usar modelos não lineares nas etapas (i) e (ii) traz um melhor desempenho. Um outro aspecto importante e desafiador próprio de um SHS é a seleção, especificação e treinamento de um modelo para a etapa (ii). Nessa etapa, DE OLIVEIRA et al. (2021) propõem um sistema chamado Dynamic Residual Forecasting (DReF) que usa um algoritmo para seleção dinâmica do modelo não linear (num conjunto de 5 modelos não lineares) mais adequado para prever os resíduos, usando na etapa (i) um modelo ARIMA ou Seasonal ARIMA e uma combinação aditiva na etapa (iii). Os resíduos podem conter flutuações randômicas, padrões não lineares complexos e apresentar comportamento heterocedástico (variância não constante). Consequentemente, podem impactar no desempenho do SHS e inclusive degradar a previsão da etapa (i). Resultados experimentais, em comparação com sistemas individuais e híbridos, demonstram que de um total de 10 séries temporais usadas, o DReF obtém uma melhor acurácia de previsão em 7 séries. Um SHS poderia mitigar o overfitting ao fazer modelagem e previsão dos resíduos (etapa (ii)) para tentar melhorar o desempenho da primeira rede (etapa (i)) e além disso, poderia modelar padrões de forma individual nas etapas (i) e (ii) usando modelos ARIMA e MLP. Somado a isso, na literatura encontram-se evidências sobre a eficácia do MLP para prever apenas padrões lineares, logo um SHS poderia melhorar tal eficácia recebendo como entradas, na etapa (ii), a série original e a previsão linear da etapa (i). No entanto, SHS possuem um problema acerca do melhor método para combinar as saídas das etapas (i) e (ii) na etapa (iii). Finalmente, devido à natureza complexa de modelagem e previsão de resíduos, os SHS possuem um desafio na etapa (ii) acerca da seleção, especificação e treinamento dos modelos.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas