Predição de Mortalidade em UTIs com Modelos de Machine Learning: Um Estudo com Kernel Ridge, SVC Calibrado e AdaBoost
##plugins.themes.bootstrap3.article.main##
Resumo
Contexto: A predição da mortalidade em Unidades de Terapia Intensiva (UTIs) representa um dos principais desafios para a área da saúde, considerando o impacto direto nas decisões clínicas, na priorização de pacientes e na alocação de recursos hospitalares. Em trabalhos anteriores, como Harutyunyan et al. (2019), técnicas como K-Nearest Neighbors (KNN) e Multilayer Perceptron (MLP) apresentaram desempenhos promissores na predição da mortalidade com base em sinais vitais e exames laboratoriais da base MIMIC-III. No entanto, a necessidade de explorar novas abordagens mais robustas, escaláveis e interpretáveis motiva a investigação de técnicas que combinem desempenho com capacidade de explicação, sobretudo diante de um cenário de dados altamente desbalanceados e esparsos.
Objetivo: Este estudo tem como objetivo comparar os resultados obtidos anteriormente com novos modelos de aprendizado de máquina, explorando classificadores mais avançados e interpretáveis como Kernel Ridge (KR), Support Vector Classifier (SVC) com calibração e AdaBoost Classifier. Busca-se, além de identificar melhorias em métricas como acurácia e F1-score, também investigar a aplicabilidade de técnicas de explicação como SHapley Additive exPlanations (SHAP) para viabilizar o uso dos modelos em sistemas de apoio à decisão clínica.
Metodologia: Utilizou-se a base MIMIC-III, composta por dados clínicos e temporais de pacientes internados em UTIs. A seleção de sinais vitais relevantes foi inspirada na metodologia proposta por Ye et al. (2023), priorizando atributos com maior correlação com a mortalidade. Foram aplicadas duas estratégias de interpolação para lidar com a alta taxa de dados ausentes: interpolação base (como preenchimento forward-fill e backward-fill) e interpolação por Random Forest Regressor, que utiliza atributos estatísticos e posicionais extraídos das séries temporais. Os dados interpolados foram normalizados com StandardScaler, e em seguida convertidos em vetores unidimensionais para alimentação dos modelos. A divisão foi feita em conjunto de treino e teste (80/20) com aplicação de técnicas de balanceamento. A escolha dos modelos se deu pela limitação de uso de regressões tradicionais (como logística e linear) devido à natureza binária do alvo (0 ou 1), levando à adoção de classificadores capazes de lidar com não linearidades, sensíveis ao desbalanceamento e com potencial de interpretabilidade. O KR foi aplicado com limiarização para tarefas de classificação, sendo reconhecido por sua capacidade de regularização eficiente e boa performance em dados com multicolinearidade (MURPHY, 2012). O SVC foi calibrado com validação cruzada para produzir probabilidades confiáveis, fundamentais para classificações clínicas mais seguras, conforme sugerido por Hu et al. (2024). Já o AdaBoost foi incluído por sua robustez em ajustar-se iterativamente aos erros de classificadores fracos, como discutido por Freund e Schapire (1997), sendo eficaz mesmo em cenários com ruído ou variabilidade nos dados. Por fim, propõe-se o uso de SHAP como método de interpretação dos modelos, conforme sugerido por Lundberg e Lee (2017), permitindo analisar a importância dos atributos clínicos nas predições. Resultados: Comparando os modelos atuais com os apresentados por Harutyunyan et al. (2019), observou-se uma melhoria considerável. Naquele estudo, os algoritmos KNN e MLP apresentaram acurácia de 0,902 e 0,897, e F1-score de 0,869 e 0,848, respectivamente. Neste trabalho, o KR obteve acurácia de até 0,929 e F1-score de 0,919. O SVC calibrado alcançou acurácia de 0,932 e F1-score de 0,923. Já o AdaBoost apresentou acurácia de 0,932 e F1-score de 0,923. Estes resultados indicam estabilidade e melhor desempenho geral, especialmente na F1-score, métrica essencial em contextos clínicos para equilibrar sensibilidade e precisão.
Conclusão: A comparação com modelos previamente utilizados evidencia avanços no desempenho e robustez das abordagens (KR, SVC calibrado e AdaBoost) em relação às técnicas de MLP e KNN proposto por Harutyunyan et al. (2019), pois as abordagens proposta aqui possuem: - Lida com Não-Linearidade e Eficiência Computacional (KR); - Redução de Viés e Variância (AdaBoost); - Menos Sensível a Hiperparâmetros (SVC). Os resultados confirmam que técnicas aqui propostas( KR, SVC calibrado e AdaBoost), aliadas a estratégias de interpolação e normalização consistentes, oferecem maior precisão na predição de mortalidade em UTIs. Além disso, ao incorporar métodos de interpretabilidade como SHAP, verifica-se que a contribuição de cada variável é calculada de forma consistente, levando em consideração todas as possíveis combinações de variáveis, permitindo entender porque uma previsão específica foi feita para um único caso, e também quais são as variáveis mais importantes para o modelo como um todo. Com isso, amplia-se o potencial de integração dos modelos em sistemas clínicos reais, promovendo maior transparência nas decisões. Como perspectiva futura, propõe-se investigar modelos baseados em aprendizado multitarefa e arquiteturas de deep learning, como LightGBM, XGBoost e transformers clínicos, conforme Hu et al. (2024), com potencial de aprendizado contextual em séries temporais e maior poder preditivo.
Objetivo: Este estudo tem como objetivo comparar os resultados obtidos anteriormente com novos modelos de aprendizado de máquina, explorando classificadores mais avançados e interpretáveis como Kernel Ridge (KR), Support Vector Classifier (SVC) com calibração e AdaBoost Classifier. Busca-se, além de identificar melhorias em métricas como acurácia e F1-score, também investigar a aplicabilidade de técnicas de explicação como SHapley Additive exPlanations (SHAP) para viabilizar o uso dos modelos em sistemas de apoio à decisão clínica.
Metodologia: Utilizou-se a base MIMIC-III, composta por dados clínicos e temporais de pacientes internados em UTIs. A seleção de sinais vitais relevantes foi inspirada na metodologia proposta por Ye et al. (2023), priorizando atributos com maior correlação com a mortalidade. Foram aplicadas duas estratégias de interpolação para lidar com a alta taxa de dados ausentes: interpolação base (como preenchimento forward-fill e backward-fill) e interpolação por Random Forest Regressor, que utiliza atributos estatísticos e posicionais extraídos das séries temporais. Os dados interpolados foram normalizados com StandardScaler, e em seguida convertidos em vetores unidimensionais para alimentação dos modelos. A divisão foi feita em conjunto de treino e teste (80/20) com aplicação de técnicas de balanceamento. A escolha dos modelos se deu pela limitação de uso de regressões tradicionais (como logística e linear) devido à natureza binária do alvo (0 ou 1), levando à adoção de classificadores capazes de lidar com não linearidades, sensíveis ao desbalanceamento e com potencial de interpretabilidade. O KR foi aplicado com limiarização para tarefas de classificação, sendo reconhecido por sua capacidade de regularização eficiente e boa performance em dados com multicolinearidade (MURPHY, 2012). O SVC foi calibrado com validação cruzada para produzir probabilidades confiáveis, fundamentais para classificações clínicas mais seguras, conforme sugerido por Hu et al. (2024). Já o AdaBoost foi incluído por sua robustez em ajustar-se iterativamente aos erros de classificadores fracos, como discutido por Freund e Schapire (1997), sendo eficaz mesmo em cenários com ruído ou variabilidade nos dados. Por fim, propõe-se o uso de SHAP como método de interpretação dos modelos, conforme sugerido por Lundberg e Lee (2017), permitindo analisar a importância dos atributos clínicos nas predições. Resultados: Comparando os modelos atuais com os apresentados por Harutyunyan et al. (2019), observou-se uma melhoria considerável. Naquele estudo, os algoritmos KNN e MLP apresentaram acurácia de 0,902 e 0,897, e F1-score de 0,869 e 0,848, respectivamente. Neste trabalho, o KR obteve acurácia de até 0,929 e F1-score de 0,919. O SVC calibrado alcançou acurácia de 0,932 e F1-score de 0,923. Já o AdaBoost apresentou acurácia de 0,932 e F1-score de 0,923. Estes resultados indicam estabilidade e melhor desempenho geral, especialmente na F1-score, métrica essencial em contextos clínicos para equilibrar sensibilidade e precisão.
Conclusão: A comparação com modelos previamente utilizados evidencia avanços no desempenho e robustez das abordagens (KR, SVC calibrado e AdaBoost) em relação às técnicas de MLP e KNN proposto por Harutyunyan et al. (2019), pois as abordagens proposta aqui possuem: - Lida com Não-Linearidade e Eficiência Computacional (KR); - Redução de Viés e Variância (AdaBoost); - Menos Sensível a Hiperparâmetros (SVC). Os resultados confirmam que técnicas aqui propostas( KR, SVC calibrado e AdaBoost), aliadas a estratégias de interpolação e normalização consistentes, oferecem maior precisão na predição de mortalidade em UTIs. Além disso, ao incorporar métodos de interpretabilidade como SHAP, verifica-se que a contribuição de cada variável é calculada de forma consistente, levando em consideração todas as possíveis combinações de variáveis, permitindo entender porque uma previsão específica foi feita para um único caso, e também quais são as variáveis mais importantes para o modelo como um todo. Com isso, amplia-se o potencial de integração dos modelos em sistemas clínicos reais, promovendo maior transparência nas decisões. Como perspectiva futura, propõe-se investigar modelos baseados em aprendizado multitarefa e arquiteturas de deep learning, como LightGBM, XGBoost e transformers clínicos, conforme Hu et al. (2024), com potencial de aprendizado contextual em séries temporais e maior poder preditivo.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Seção
Engenharia da Computação e Sistemas