Uma abordagem híbrida utilizando agrupamento e regressão no contexto de mineração de dados

##plugins.themes.bootstrap3.article.main##

Marília Lima
Roberta Fagundes

Resumo

A utilização de técnicas de inteligência computacional para resolução de problemas tem se tornado uma necessidade, sobretudo nas áreas de medicina, educação, entre outras (SHAKOOR et al., 2017). Uma vez que existe uma quantidade cada vez maior de dados sendo armazenados e através desses dados podem ser extraídas informações relevantes. Uma das técnicas utilizadas para extração de informação é o agrupamento que apresenta como característica agrupar dados com maior similaridade em um mesmo grupo e os diferentes grupos formados devem apresentar uma maior dissimilaridade (JAIN and MURTY, 1999). Técnicas de regressão também são muito utilizadas. A análise de regressão é um método estatístico e tem como objetivo verificar a relação entre variáveis. Dentre os métodos de regressão existem a regressão linear, robusta, entre outras (MONTGOMERY, 2012). Entretanto algumas dessas técnicas em sua versão básica apresentam certa fragilidade para resolver esses problemas, por isso o desenvolvimento de modelos híbridos para área de Inteligência Computacional vem se tornando uma abordagem promissora (DE ANDRÉS et al, 2011). Dessa forma, as abordagens híbridas são utilizadas para minimizar as fragilidades dos algoritmos em sua forma básica, uma vez provam ser eficazes, pois combinam as vantagens dos métodos envolvidos (POOJA, 2015). Neste contexto o presente trabalho tem como objetivo desenvolver uma abordagem híbrida que utilize agrupamento e regressão no contexto de mineração de dados para extração de conhecimento, os algoritmos utilizados serão o k-means, a regressão linear e a regressão robusta. Adicionalmente, este trabalho poderá impulsionar resultados interessantes para problemas do mundo real, uma vez que poderá possibilitar benefícios econômicos e sociais com a utilização do mesmo na extração de informações em base de dados.  Estando o presente trabalho em andamento, os resultados são relativos a uma revisão sistemática da literatura. Através desta revisão pode-se observar que a técnica de agrupamento mais utilizada para o desenvolvimento de abordagens híbridas foi o algoritmo K-means, e sendo a regressão SVR (Suport vector Regression) mais utilizada, ainda pode-se verificar que abordagens híbridas podem vir a potencializar o resultado da estimação.Palavras-chave: Abordagem Híbrida; Agrupamento; Regressão; Mineração de Dados

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas

Referências

SHAKOOR, Md Tahmid et al. Agricultural production output prediction using Supervised Machine Learning techniques. In: Next Generation Computing Applications (NextComp), 2017 1st International Conference on. IEEE, 2017. p. 182-187.

JAIN, Anil K.; MURTY, M. Narasimha; FLYNN, Patrick J. Data clustering: a review. ACM computing surveys (CSUR), v. 31, n. 3, p. 264-323, 1999.

MONTGOMERY, Douglas C.; PECK, Elizabeth A.; VINING, G. Geoffrey. Introduction to linear regression analysis. John Wiley & Sons, 2012.

DE ANDRÉS, Javier et al. Bankruptcy forecasting: A hybrid approach using Fuzzy c-means clustering and Multivariate Adaptive Regression Splines (MARS). Expert Systems with Applications, v. 38, n. 3, p. 1866-1875, 2011

POOJA, M. R.; PUSHPALATHA, M. P. A hybrid decision support system for the identification of asthmatic subjects in a cross-sectional study. In: Emerging Research in Electronics, Computer Science and Technology (ICERECT), 2015 International Conference on. IEEE, 2015. p. 288-293.