Desenvolvimento de um modelo de deep learning para classificação de Dengue e Chikungunya

##plugins.themes.bootstrap3.article.main##

Thomás Tabosa Oliveira
Sebastião Rogério da Silva
Patricia Takako Endo
Vanderson Sampaio

Resumo

Existem cerca de 545 espécies de arbovírus e cerca de 150 dessas podem infectar seres humanos (LOPES; NOZAWA; LINHARES, 2014). A Dengue e a Chikungunya, que são transmitidas pelos mosquitos Aedes Aegypti e o Aedes Albopictus, são as mais conhecidas. Segundo os relatórios de (PLISA, 2020a, 2020b), no ano de 2019 essas duas doenças juntas ocasionaram um total de 3.349.019 casos nas Américas, resultando em 1.667 mortes. Dessa quantidade total de casos, 3.167.542 são de casos notificados de Dengue, sendo que apenas 1.413.801 (44,63%) destes foram efetivamente confirmados; enquanto que dos 181.477 casos notificados de Chikungunya, 101.190 (55,76%) foram confirmados. Esta baixa porcentagem de confirmação se deve ao fato de que essas doenças possuem sintomas semelhantes, tornando difícil a correta classificação entre Dengue, Chikungunya ou outra doença. O Brasil é um dos países mais afetados pelos arbovírus, onde cerca de 15,4% dos casos de 2019 ocorreram no país. Isto ocorre devido ao fato de que o Brasil é um país tropical, e possui condições climáticas favoráveis à proliferação do mosquito. Segundo Lima-Camara (2016), o Brasil também possui uma grande quantidade de outras arboviroses concomitantes, e somado com a ineficiência de alguns testes sorológicos por conta de apresentar reação cruzada, o diagnóstico de arbovírus no país torna-se um problema ainda mais sério. Estes problemas de classificação associados também ao fator de financiamento reduzido na área de saúde, destaca a necessidade de uma abordagem de baixo custo e acessível. Com isso, o presente trabalho propõe um modelo de deep learning para classificação de Dengue e Chikungunya utilizando dados clínicos para treinamento. Após uma análise do estado da arte sobre o tema, percebe-se uma grande lacuna de estudos que aplicam deep learning para classificação de arboviroses usando dados clínicos. A maioria dos trabalhos estão focados na classificação do sorotipo de Dengue, como em Pandiyarajan e Thangairulappan (2018), ou classificação se o paciente está ou não com Chikungunya, como em Hossain et al. (2019). Além disso, nenhum deles utiliza dados clínicos documentados pelos sistemas de saúde para treinar os seus modelos, recorrendo a alternativas mais simples (HOSSAIN et al., 2019) ou utilizando amostras de pele (PANDIYARAJAN; THANGAIRULAPPAN, 2018) que necessitam de aparelhos para coleta. O presente trabalho irá utilizar dados clínicos da base de dados do SINAN (Sistema de Informação de Agravo de Notificação) (SINANWEB, 2020) contendo dados do estado do Amazonas e do banco de dados aberto da cidade do Recife (Dados Recife, 2020), ambos entre os anos 2015 e 2019. Estas bases possuem dados clínicos, como sintomas e afins, que serão usados no treinamento do modelo para classificação. Atualmente, este trabalho está em desenvolvimento, no processo de pré-processamento da base de dados e seleção das melhores features da base que irão ser inseridas no treinamento do modelo.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas
Biografia do Autor

Sebastião Rogério da Silva, Universidade de Pernambuco

Doutorando em Engenharia da Computação pela Universidade de Pernambuco (POLI-UPE). Mestre em Informática pelo Instituto de Computação (IC) da Universidade Federal de Alagoas (UFAL). Graduado em Licenciatura em Computação pela Universidade de Pernambuco Campus Garanhuns. Pesquisador do dotLAB Brazil. Atualmente leciona na Escola Técnica Estadual Governador Eduardo Campos no município de São Bento do Una - PE. Áreas de Interesse Acadêmico: Deep Learning, Machine Learning, Text Mining, Desenvolvimento de Games, Games na Educação, Inteligência Artificial, Ensino de Computação.

Patricia Takako Endo, Universidade de Pernambuco

Atualmente é professora adjunta de graduação da Universidade de Pernambuco (UPE) - Campus Caruaru, e membro permanente do Programa de Pós-Graduação em Engenharia de Computação (PPGEC) da Escola Politécnica de Pernambuco (POLI/UPE), atuando como coordenadora Setorial de Pesquisa do Campus Caruaru e vice-coordenadora do PPGEC. É líder do GRupo de Estudos Avançados em Tecnologia da Informação e Comunicação (GREAT) e do dotLAB Brazil da UPE, pesquisadora do Grupo de Pesquisa em Redes e Telecomunicações (GPRT) da UFPE e pesquisadora colaboradora na Dublin City University (DCU), Irlanda. Possui doutorado em Ciência da Computação pelo Centro de Informática (CIn) pela Universidade Federal de Pernambuco (2014), mestrado em Ciência da Computação pela Universidade Federal de Pernambuco (2008) na área de Redes de Computadores e graduação em Engenharia de Computação pela Universidade Federal do Pará (2005). Tem experiência na área de Engenharia da Computação, com ênfase em redes de computadores, telecomunicações e data science, atuando principalmente nos seguintes temas: tecnologias de rede, redes wireless, cloud computing, fog computing, sistemas e-health, data science aplicada a saúde.

Vanderson Sampaio, Fundação de Medicina Tropical

É Doutor em Medicina Tropical pela Universidade do Estado do Amazonas e Fundação de Medicina Tropical Doutor Heitor Vieira Dourado, mestre em Genética e Biologia Molecular pela Universidade Federal do Pará, especialista em Bioinformática pelo Laboratório Nacional de Computação Científica (LNCC) e graduado em Biologia também pela Universidade Federal do Pará (2001). É Pesquisador Adjunto na Fundação de Medicina Tropical Dr. Heitor Vieira Dourado (FMT-HVD), onde atua em projetos de pesquisa nacionais e internacionais envolvendo Doenças Infecciosas e Tropicais como Malária, Tuberculose, arboviroses, HIV/AIDS, Leishmaniose, Doenças de Chagas, etc. É também Professor do quadro permanente dos Programas de Pós-Graduação em Medicina Tropical (UEA/FMT-HVD) e de Ciências da Saúde (UFAM), onde orienta estudantes de mestrado e doutorado. É Biólogo da Fundação de Vigilância em Saúde do Amazonas (FVS-AM) desde 2006. Como técnico da FVS-AM, atuou no nível gerencial, assessorando os Programas de Controle de Doenças de Transmissão Vetorial, nos componentes: entomologia e controle vetorial, diagnóstico e tratamento de doenças, políticas dos programas, organização logística e capacitações nos temas citados. Possui conhecimentos nas áreas de Epidemiologia, bioestatística e análise de dados, entomologia, controle vetorial, georreferenciamento, uso de sistemas de informação geográfica e desenvolvimento de softwares e scripts para análise de bancos de dados computacionais.