Predição de casos de arboviroses transmitidas pelo mosquito Aedes aegypti: uma abordagem utilizando computação de reservatório

##plugins.themes.bootstrap3.article.main##

Clarisse Lins de Lima
Wellington Pinheiro dos Santos
Ana Clara Gomes da Silva

Resumo

Introdução: As arboviroses, grupo de doenças causadas por vírus os quais são transmitidos por meio de um vetor de transmissor, artrópode hematófago e um hospedei grupo de doenças, atingem, principalmente, as regiões tropicais e subtropicais, que abrigam cerca de 3,9 bilhões de pessoas. Os modelos de predição baseados em aprendizagem de máquina podem ser ferramentas importantes no combate às arboviroses, pois são capazes de evidenciar os padrões das doenças, permitindo que haja tempo hábil para tomar medidas de prevenção antes do surto ocorrer. As máquinas de aprendizado extremo (do inglês, Extreme Learning Machine, ELM) podem ser uma ferramenta para criar esses modelos de predição uma vez que são mais rápidas de treinar quando comparadas com modelos clássicos como redes neurais, por exemplo.  Objetivo: Sendo assim, o objetivo deste trabalho é a construção de um modelo de classificador utilizando arquitetura de computação de reservatório para indicar o intervalo da concentração dos casos de arboviroses nos bairros da cidade do Recife, a partir dos dados públicos da quantidade de casos das doenças, variáveis climáticas. Metodologia: Os dados relacionados aos casos de arboviroses foram obtidos através do Portal de Dados Abertos da Prefeitura do Recife para os anos de 2013-2016. Para cada bairro do Recife, foi considerada a soma dos casos confirmados de Dengue, Zika e Chikungunya. Além disso, os dados referentes aos casos foram organizados por bimestre, visto que as políticas de combate às arboviroses adotadas pelo Sistema Único de Saúde (SUS) são realizadas a cada bimestre . As variáveis climáticas foram retiradas das bases de dados da Agência Pernambucana de Águas e Climas (APAC) e do Instituto Nacional de Meteorologia (INMET). Da APAC, obtiveram-se as séries históricas das precipitações mensais para os anos de 2013-2016, enquanto os dados da velocidade dos ventos e temperatura, para o mesmo período, foram obtidos do INMET. Com as informações de casos e dadas variáveis climáticas da cidade do Recife, construíram-se mapas da distribuição espacial dessas doenças por meio da interpolação IDW (Inverse Distance Weighted). Em seguida, os mapas de distribuição espacial construídos foram varridos simultaneamente, armazenando as informações na seguinte ordem: latitude, longitude, distribuição bimestral dos casos e distribuição da temperatura, chuva e velocidade dos ventos para os respectivos meses do bimestre. Para a elaboração de cada conjunto de predição, considerou-se informações de seis bimestre consecutivos que antecedem o bimestre de predição. Para encontrar o número ótimo de classes para o problema, aplicou-se a Regra de Sturges. A técnica SMOTE (do inglês, Synthetic Minority Oversampling Technique) foi utilizada para balancear os conjuntos de dados, com um k=3. Para o treinamento dos modelos, foram utilizadas as máquinas de aprendizado extremo (ELMs) da biblioteca PyRCN, nas seguintes configurações: camada única, duas, cinco e 10 camadas de input-to-node. Em cada configuração, o número de neurônios foi de 10, 20, 50 e 100 neurônios em cada uma das camadas. Os modelos treinados foram avaliados de acordo com a acurácia, precision e recall. Cada experimento foi rodado 30 vezes com validação cruzada de 10-folds. Resultados: De acordo com os resultados preliminares, os experimentos apontaram um bom desempenho para a maioria dos modelos treinados. O valor da acurácia atingida pela maioria dos modelos esteve entre 0,7620 e 0,9623, com exceção da configuração com 10 camadas e 100 neurônios, em que o valor atingido foi de 0,6261. Para esta mesma configuração, os valores obtidos para as métricas de precision e recall foram de 0,6266 e 0,63419, respectivamente. As configurações de camada única e duas camadas, com 100 neurônios em suas respectivas camadas, obtiveram resultados semelhantes. Para a primeira, os valores da acurácia, precision e recall foram de 0,9622, 0,9622 e 0,9629, respectivamente, enquanto para a segunda, os resultados para essas mesmas métricas foram de 0,9623, 0,9623 e 0,9629, respectivamente. Conclusão: Conforme indicam os experimentos, as arquiteturas de extreme learning machines podem auxiliar na construção de modelos com altas taxas de assertividade para a predição dos casos de arboviroses no Recife. Como trabalhos futuros pretende-se construir os mapas de distribuição espacial a partir dos dados da predição para que sejam fornecidas informações espaciais de interesse epidemiológico. Os mapas de distribuição espacial podem embasar as autoridades de saúde nas tomadas de decisão tanto no planejamento quanto na implementação de políticas públicas de prevenção de arboviroses.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas