Modelo de predição de covid-19 em Pernambuco.
##plugins.themes.bootstrap3.article.main##
Resumo
Introdução – A COVID-19 emergiu em 2019 e, em poucos meses, causou milhões de casos e mortes em todo o mundo, dano sem precedentes na História recente. Além disso, a imunidade após infecção de COVID-19 desaparece em poucos meses. Portanto, o número de indivíduos sujeitos a infecção se mantém alto e os sistemas de saúde precisam, com urgência, de ações para conter a disseminação da doença. Em Pernambuco, índices como taxa de infecção e mortalidade estão acima da média do Brasil. A WHO defende em (WHO, 2021) o uso de inteligência artificial na tomada de decisão e planejamento, na classificação e no diagnóstico, bem como na modelagem e previsão de doenças. Trabalhos Relacionados – Yang et al. (2020) propõem o modelo SEIR (Susceptible, Exposed, Infectious, Recovered) e utilizam inteligência artificial para prever casos de COVID-19 na China. Em (GONDIM; MACHADO 2020), Gondim e Machado propõe o modelo SEIRQ (Susceptible, Exposed, Infectious, Recovered, Quarentine) e analisa estratégias ótimas de quarentena a fim de auxiliar na tomada de decisão dos gestores de saúde pública. Da Silva et al. (2021) utilizam várias abordagens de aprendizagem de máquina para prever em tempo real os casos acumulados de COVID-19 no Brasil. Objetivo – Prever os números de óbitos por COVID-19 em Pernambuco utilizando abordagens de aprendizagem de máquina de forma que os municípios conheçam os dados previstos com antecedência de 5 dias a fim de auxiliar nas estratégias de controle da transmissão do vírus. Metodologia – Neste trabalho foram utilizadas quatro etapas baseado na metodologia CRISP-DM (SHEARER, 2000) para execução do objetivo mencionado, são elas: (i) Descrição do Problema – A partir dos dados abertos de COVID-19 da Secretaria de Planejamento e Gestão de Pernambuco (SEPLAG), efetuar uma análise descritiva, relacionando dados históricos de outras bases que representem índices de relevância da pandemia. (ii) Pré-Processamento dos Dados – A ferramenta Pentaho Data Integration foi utilizada para unir diferentes informações, relacionando-as, e para criação de novos atributos, a partir de dados já existentes. A partir de análise de correlação, deu-se a seleção de atributos. Foram utilizados os seguintes atributos: data de referência, confirmados, recuperados, óbitos, taxa de óbitos, taxas de ocupação dos leitos hospitalares. Foram ainda criados atributos com números de óbitos e casos confirmados diários, e a taxa de testes positivos. A partir dos dados abertos da Secretaria de Saúde de Pernambuco, foram criados atributos de vacinação contra COVID-19: aplicações diárias de vacinas e total de imunizações completas. Para medir o isolamento social, foram usados os dados de mobilidade disponibilizados pela Google. Foram também registrados os dias de decreto de restrição em relação a atividades sociais e econômicas, e os feriados. (iii) Modelagem – Modelos ARIMA, MLP e LSTM foram utilizados para predição de óbitos diários. A hipótese inicial era de que o mais indicado era o modelo LSTM por se tratar de predição de série temporal que requer memórias de longo alcance. Os modelos foram, por fim, comparados observando as métricas de qualidade como RMSE e MAE. (iv) Avaliação dos Resultados – Embora todas as abordagens tenham mostrado boa capacidade de predição de óbitos por COVID-19 em caso de não interferência dos sistemas de saúde pública de Pernambuco, a LSTM apresentou os melhores resultados de previsão.
Modelo
RMSE
MAE
ARIMA
0.0069048424471712
0.06568956673404
MLP
0.0108608267580629
0.08431819162692
LSTM
0.0016874730361961
0.03016076680450
Para avaliação qualitativa, foram feitas previsões temporais para o período de 26 de agosto a 09 de setembro de 2021.
Conclusões – As abordagens de aprendizagem de máquina conseguiram prever, com erro aceitável, os óbitos por COVID-19 e tem potencial para auxiliar a gestão de saúde no que diz respeito ações de prevenção e educação para controle da pandemia. Além disso, foram observados alguns fatores de alerta sobre o controle da epidemia, como a alta positividade, a alta taxa de reprodução e as baixas taxas de isolamento social.
Palavras-chave: Aprendizagem de máquina; COVID-19; predição; LSTM.
Referências
WORLD HEALTH ORGANIZATION et al. Ethics and governance of artificial intelligence for health: WHO guidance. 2021.
YANG, Zifeng et al. Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions. Journal of thoracic disease, v. 12, n. 3, p. 165, 2020.
GONDIM, João AM; MACHADO, Larissa. Optimal quarantine strategies for the COVID-19 pandemic in a population with a discrete age structure. Chaos, Solitons & Fractals, v. 140, p. 110166, 2020.
DA SILVA, Cecilia Cordeiro et al. Covid-19 dynamic monitoring and real-time spatio-temporal forecasting. Frontiers in Public Health, v. 9, 2021.
SHEARER C. The CRISP-DM model: the new blueprint for data mining. J Data Warehousing 2000;5:13—22.
Modelo
RMSE
MAE
ARIMA
0.0069048424471712
0.06568956673404
MLP
0.0108608267580629
0.08431819162692
LSTM
0.0016874730361961
0.03016076680450
Para avaliação qualitativa, foram feitas previsões temporais para o período de 26 de agosto a 09 de setembro de 2021.
Conclusões – As abordagens de aprendizagem de máquina conseguiram prever, com erro aceitável, os óbitos por COVID-19 e tem potencial para auxiliar a gestão de saúde no que diz respeito ações de prevenção e educação para controle da pandemia. Além disso, foram observados alguns fatores de alerta sobre o controle da epidemia, como a alta positividade, a alta taxa de reprodução e as baixas taxas de isolamento social.
Palavras-chave: Aprendizagem de máquina; COVID-19; predição; LSTM.
Referências
WORLD HEALTH ORGANIZATION et al. Ethics and governance of artificial intelligence for health: WHO guidance. 2021.
YANG, Zifeng et al. Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions. Journal of thoracic disease, v. 12, n. 3, p. 165, 2020.
GONDIM, João AM; MACHADO, Larissa. Optimal quarantine strategies for the COVID-19 pandemic in a population with a discrete age structure. Chaos, Solitons & Fractals, v. 140, p. 110166, 2020.
DA SILVA, Cecilia Cordeiro et al. Covid-19 dynamic monitoring and real-time spatio-temporal forecasting. Frontiers in Public Health, v. 9, 2021.
SHEARER C. The CRISP-DM model: the new blueprint for data mining. J Data Warehousing 2000;5:13—22.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Edição
Seção
Engenharia da Computação e Sistemas