Support Vector Regression utilizando Algoritmos de Otimização Mono-objetivo e Multiobjetivo

##plugins.themes.bootstrap3.article.main##

Manoel Alves de Almeida Neto
Roberta Andrade de Araujo Fagundes
Carmelo Jose Albanez Bastos Filho

Resumo

Em diversas áreas da ciência, tais como médica, biológica, engenharia e química, é de grande interesse saber se duas ou mais variáveis estão relacionadas de alguma forma, e essas variáveis são: variáveis independentes (x); e variáveis dependentes (y). Portanto, análise de Regressão é uma ferramenta estatística que tem como objetivo explicar o relacionamento entre essas variáveis através modelos matemáticos (MONTGOMERY, 2007). O método de Support Vector Regression (SVR) é baseada na análise de regressão que tem como objetivo gerar o número máximo de vetores de suporte com valores pequenos de erros a fim de separar os dados da melhor forma possível (DUCKER et al., 1997). A seleção de parâmetros e ajustes de modelos de regressão são problemas muito complexos de se resolver, pois, na maioria das vezes, a combinação entre dois ou mais parâmetros de uma técnica de regressão (e.g.,SVR) pode ser infinita (MIETTINEN, 2012). Os algoritmos de otimização são técnicas computacionais que têm como finalidade realizar a minimização e/ou maximização de uma ou mais funções através de alterações feitas nos parâmetros dessas funções, chamadas de funções objetivo (HWANG; MASUD, 2012). Esses algoritmos são classificados em mono-objetivo, quando há apenas uma função; e multiobjetivo, para duas ou mais funções (HWANG; MASUD, 2012). Com isso, este trabalho tem como objetivo a utilização da SVR hibridizada com os algoritmos de otimização mono-objetivo e multiobjetivo para minimizar as métricas de avaliação do modelo de regressão: Média do Erro Absoluto (MEA) e Raiz do Erro Médio Quadrático (REMQ). Dessa forma, novos modelos de regressão foram propostos utilizando algoritmos de otimização por enxames: Support Vector Regression Particle Swarm Optmizaion (SVR-PSO); Support Vector Regression Fish School Search (SVR-FSS); Support Vector Regression Speed constrained Multi-objective PSO (SVR-SMPSO); e Support Vector Regression Multi-objective Fish School Search (SVR-MOFSS). Como resultados preliminares, utilizou-se a base de dados Concrete Compressive Strength (YEH, 1998) que contém 1030 instâncias, 8 variáveis independentes e 1 variável dependente. O propósito dessa base de dados é prever o valor da força de compressão que uma estrutura de concreto poderá ter através da combinação de materiais base: cimento; escória de alto-forno; cinzas volantes; água; superplastificante; agregado grosseiro; agregado fino; e tempo (em dias). A base de dados foi divida em duas partes, onde 70% dos dados foram utilizados para fazer o treinamento, e 30% para testes. Utilizou-se 20 partículas no enxame, 200 iterações e 30 execuções para cada algoritmo proposto. Com relação aos valores dos parâmetros da SVR, ε margem de erro entre os valores reais e previstos para cada vetor de suporte, C custo e ℽ que é o parâmetro da função Kernel de base radial, optou-se utilizar ε[1.00E-12,1.00E+12], C[1E-12,20] e ℽ[0.01,1]. Devido os resultados de erros obtidos não seguirama distribuição gaussiana, o teste de Wilcoxon não pareado foi utilizado. Dessa forma, os modelos baseados no PSO, SVR-PSO e SVR-SMPSO, obtiveram melhores resultados em relação aos baseados no FSS, SVR-FSS e SVR-MOFSS a um nível de confiança de 95%.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas
Biografia do Autor

Manoel Alves de Almeida Neto, Universidade de Pernambuco - UPE

Departamento de Engenharia de Computação, Mestrado em Engenharia de Computação

Roberta Andrade de Araujo Fagundes, Universidade de Pernambuco - UPE

Departamento de Engenharia de Computação, Mestrado em Engenharia de Computação

Carmelo Jose Albanez Bastos Filho, Universidade de Pernambuco - UPE

Departamento de Engenharia de Computação, Mestrado em Engenharia de Computação.

Referências

MIETTINEN, K. Nonlinear multiobjective optimization. Springer Science & Business Media, 2012. v. 12.

HWANG, C.-L.; MASUD, A. S. M. Multiple objective decision making-methods and applications: a state-of-the-art survey. [S.l.]: Springer Science & Business Media, 2012. v. 164.

MONTGOMERY, D. C. Introduction to statistical quality control. John Wiley & Sons, 2007.

Yeh IC. Modeling of strength of high-performance concrete using artificial neural networks. Cement and Concrete research. Dezembro 1998. p 1797-808.

MEHTA, P. K.; MONTEIRO, P. J. M. Concreto: estrutura, propriedades e materiais. São Paulo: Editora Pini, 2008. 616 p.

DRUCKER H, BURGES CJ, KAUMFMAN L, SMOLA AJ, VAPNIK V. Support vector regression machines. In Advances in neural information processing systems 1997. p 155-161.