Métodos de Regressão Quantílica Não Paramétrico utilizando inteligência de exames para dados simbólicos do tipo intervalo

##plugins.themes.bootstrap3.article.main##

Ricardo Batista das Neves Junior
Roberta Andrade de Araújo Fagundes

Resumo

Análise de regressão é uma ferramenta estatística que investiga a relação entre duas ou mais variáveis. As variáveis podem apresentar-se em sua representação clássica ou através dos dados simbólicos do tipo intervalo (DSTI) que fazem parte do contexto da Análise de Dados Simbólicos (ADS) (BILLARD, 2006). A regressão quantílica (RQ) introduzida por Koenker (KOENKER, 2006), destaca-se em relação aos demais tipos de regressão, enquanto as regressões usuais permitem a interpretação do modelo com apenas uma curva, a RQ permite a utilização de várias curvas (ou quantís) para que se possa obter uma visão mais completa da relação entre as variáveis estudadas. Na utilização modelo de regressão quantílica não paramétrica (RQNP), o kernel gaussiano pode ser aplicado mediante ao ajuste do parâmetro largura de banda (i.e., h), que controla o grau de suavidade da função estimada. Atualmente na literatura o modelo existente de RQNP é utilizado para dados clássicos pontuais, entretanto existem situações onde há necessidade de aplicar modelos de regressão para DSTI. O Particle Swarm Optimization (PSO) é um algoritmo da área de Inteligência de Enxames, inspirado no comportamento dos pássaros, capaz de resolver problemas de otimização em espaços de busca multidimensionais (KENNEDY, 1995). Neste contexto, é proposto: (i) desenvolver um modelo de RQNP para DSTI; (ii) desenvolver dois modelos de RQNP hibridizados com PSO, capazes de estimar o parâmetro largura de banda do kernel gaussiano; sendo um para dados clássicos pontuais e outro para DSTI. Como resultado preliminar, foi desenvolvido o modelo de regressão quantílica intervalar não paramétrica (RQINP) citado como primeiro objetivo e comparado com o modelo regressão quantílica intervalar (RQI) introduzida por Fagundes et al., (FAGUNDES, 2016). Como metodologia adotada, os modelos RQINP e RQI foram submetidos à experimentos utilizando dados reais e simulados em que estes dados possuíam um comportamento predominantemente não linear com ruídos e outliers. Após a realização dos experimentos, foi utilizado o teste estatístico de Wilcixon com 5% de significância para avaliar se o modelo RQINP é estatisticamente superior ao RQI. Concluiu-se que o modelo RQINP obteve melhores resultados porque o modelo não paramétrico é mais robusto na presença de dados não lineares, com ruídos e outliers.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas
Biografia do Autor

Ricardo Batista das Neves Junior, Poli - Universidade de Pernambuco

Mestrando em Engenharia da Computação pela Universidade de Pernambuco (POLI/UPE), Bacharel em Ciências da Computação pela Faculdade dos Guararapes (FG).

Roberta Andrade de Araújo Fagundes, Poli - Universidade de Pernambuco

Pós-Doutora em Estatística pela Universidade Federal de Pernambuco(2015),Doutora em Ciência da Computação(2013) pela Universiade Federal de Pernambuco(UFPE), Mestre em Ciência da Computação (2006) pela Universidade Federal de Pernambuco (UFPE), Graduada em Tecnologia em Telemática (2002) pelo Centro Federal de Educação Tecnológica da Paraíba (CEFET-PB).

Referências

L. BILLARD AND E. DIDAY. Symbolic Data Analysis: Conceptual Statistics and Data Mining. Wiley, West Sussex, England, 2006.
KOENKER, ROGER. Quantile regression. No. 38. Cambridge university press, 2005.
J. KENNEDY E R. EBERHART. Particle swarm optimization. vol. 4, pp 4945-4948.
FAGUNDES, ROBERTA AA, RENATA MCR DE SOUZA, AND YANNE MG SOARES. Quantile regression of interval-valued data. Pattern Recognition (ICPR), 2016 23rd International Conference on. IEEE, 2016.