Uma análise comparativa de conversores de dados tabulares em imagem para uso em redes neurais convolucionais.

##plugins.themes.bootstrap3.article.main##

Leonides Medeiros Neto
Patricia Takako Endo

Resumo

Contextualização: O avanço da tecnologia possibilitou a captura de quantidades de dados tão grandes que, por vezes, requerem o uso de ferramentas apropriadas para a obtenção de informações úteis (DASH, S. et al. 2019). Os dados podem ser de diferentes tipos, como tabular, imagem e texto, dos quais os dados tabulares têm sido amplamente utilizados com ferramentas como Machine Learning (ML) em tarefas como o auxílio na tomada de decisão (BORISOV et al., 2021). Na área da saúde, por exemplo, dados de prontuários médicos anotados com o diagnóstico do paciente podem ser utilizados para treinar algoritmos de ML para auxiliar os profissionais de saúde na tomada de decisão médica (OLIVEIRA et al., 2022). Os modelos de ML podem ser do tipo baseado em árvores, e são comumente utilizados com dados tabulares. Além desses tipos, existem também os modelos de Deep Learning (DL) que são inspirados no funcionamento do cérebro humano, e utilizam geralmente dados como imagens, texto e som (JANIESCH et al., 2021). Modelos de DL têm obtido altos desempenhos, especialmente aqueles que lidam com classificação de imagens, contudo, DL não é amplamente utilizado com dados tabulares (BORISOV et al., 2021). Apesar disso, há algumas formas de utilizar DL com dados tabulares, uma delas é a conversão em imagens para uso em modelos como Convolutional Neural Network (CNN). Por exemplo, Zhu et al. (2021) e Sharma et al. (2019) propuseram algoritmos que convertem registros de dados tabulares em imagens para treinar modelos CNN para a classificação supervisionada. Os conversores criam uma imagem em escala de cinza para cada registro, porém, diferem na forma como é efetuada a conversão. Objetivos: Este trabalho visa comparar conversores de dados tabulares em imagens treinando e avaliando o desempenho de um modelo CNN na classificação de doenças. Também analisamos se o modelo CNN alcança maiores resultados comparado com um modelo ML em um data set de saúde. Materiais e métodos: Este trabalho utiliza um data set de arboviroses, contendo notificações de Dengue e Chikungunya do estado do Amazonas, Brasil, e da Cidade de Recife, Pernambuco, Brasil,  apresentado anteriormente no trabalho de Oliveira et al. (2022). Os dados do estado do Amazonas provêm do Sistema Brasileiro de Informação de Agravos de Notificação (SINAN), e os dados da cidade de Recife originam-se do Portal de Dados Abertos do Recife (OLIVEIRA et al., 2022). O data set  foi utilizado para a classificação entre as classes Arbovirose e Inconclusivo, contendo 11.448 registros, sendo 5.724 para cada classe. Para a conversão dos dados foram utilizados dois conversores de dados tabulares em imagens: (i) Image Generator for Tabular Data (IGTD) (ZHU et al., 2021) e (ii) Deepinsight (SHARMA et al., 2019). Estes conversores associam um píxel na imagem em escala de cinza para cada atributo da base de dados tabulares (a intensidade do píxel reflete o valor do atributo) e representam as relações entre atributos através de relações entre pixeis. O conversor proposto por Zhu et al. (2021) posiciona atributos similares (de acordo com uma medida de distância) em pixeis próximos na imagem e atributos dissimilares em pixeis distantes. Já o conversor proposto por Sharma et al. (2019) reduz a dimensionalidade dos dados tabulares utilizando algoritmos como Principal Component Analysis (PCA) para um espaço 2D, e baseado nas coordenadas dos atributos o conversor cria uma imagem mantendo suas posições proporcionalmente, podendo o usuário definir o tamanho das imagens.  O modelo CNN utilizado para realizar a comparação foi chamado de “CNN básica”. O modelo foi composto por 1 camada convolucional, 1 max pooling, 1 flatten e 1 densa. A camada convolucional possui 32 filtros 3x3, 1 stride, e função de ativação relu, como as imagens já são pequenas, foi adicionado zero padding para manter o tamanho constante. Já a camada max pooling foi configurada com um tamanho de pool de 2x2, 1 stride e zero padding mantendo o tamanho da imagem. A camada flatten não recebe argumentos, a camada densa foi configurada com 2 neurônios, e função de ativação sigmoide, o modelo foi compilado em 200 epochs com o otimizador Adam (KINGMA; BA, 2014) e função erro entropia cruzada. A metodologia de experimento consistiu em uma análise comparativa de um modelo CNN treinado em dados tabulares convertidos em imagens por cada conversor, e um modelo de ML proposto por NETO, S. et al. (2022) que utilizou o mesmo data set. Primeiro, os conversores IGTD e Deepinsight geraram imagens 6x6, e 7x7 para treinar a CNN básica. Uma comparação foi feita entre a CNN básica treinada com imagens de cada conversor  e o modelo ML. As CNNs básicas e o modelo ML foram treinados 30 vezes para analisar os resultados de média macro. Resultados: Os resultados demonstram que a CNN básica treinada com o data set tabular convertido pelo IGTD alcançou 55% de acurácia, recall, e precisão, e 54% de f1-score. Enquanto a CNN treinada com imagens do Deepinsight obteve 72% de acurácia, recall e f1-score, e 73% de precisão. Já o modelo de ML treinado em dados tabulares por NETO, S. et al. (2022), o XGboost,  obteve 74% em todas as métricas. Conclusão: Apesar de os dados tabulares serem extensivamente utilizados com modelos de ML, também é possível utilizá-los com DL. Os modelos de DL têm alcançado altas desempenhos em classificação com dados não tabulares, particularmente os modelos que lidam com imagens (BORISOV et al., 2021). Este trabalho propôs o uso de DL com imagens provindas de conversores de dados tabulares em imagem para uso em CNNs. Foram realizados experimentos comparativos, treinando CNNs com imagens de dois conversores diferentes para analisar seus desempenhos. Também comparamos as CNNs com um modelo tradicional de ML otimizado e treinado nos dados tabulares originais. Os resultados demonstram ser possível utilizar CNNs com dados tabulares convertidos em imagens. Os resultados dos experimentos mostram que, com um data set de saúde, mesmo um modelo CNN básico pode alcançar desempenhos comparáveis a um modelo de ML otimizado com mesmo data set abordando o mesmo problema de classificação. As limitações deste trabalho incluem o número de conversores utilizados, somente 2. Além disso, o trabalho se limitou a um modelo de CNN básico, e à classificação binária entre as classes Arboviroses ou Inconclusivo. Trabalhos futuros podem incluir mais conversores, o uso de um modelo de CNN melhorado, e a abordagem de outros problemas como a classificação de Sífilis Congênita.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas