Use of machine learning to assess the costs of hospital inpatient care
1Escola Escola Politécnica de Pernambuco, Universidade de Pernambuco, Recife, Brasil. E-mail: ano@ecomp.poli.br
2Universidade Federal Pernambuco, Recife, Brasil.
DOI: 10.25286/repa.v11i1.3526
Esta obra apresenta Licença Creative Commons Atribuição-Não Comercial 4.0 Internacional.
Como citar este artigo pela NBR 6023/2018: Anderson Oliveira; Paulo Henrique; Leonardo Nanes; Wellington Santos. Uso do Aprendizado de Máquina para Avaliar os Custos com a Assistência de Internação Hospitalar. Revista de Engenharia e Pesquisa Aplicada, v.11, n. 1, p. 19-30, 2026.
RESUMO
PALAVRAS-CHAVE: Aprendizado de Máquina; Alocação de Recursos; Assistência de Internação Hospitalar; Sistema Único de Saúde (SUS).
ABSTRACT
This article investigates how machine learning techniques can support public managers in evaluating Hospital Admission Authorization (AIH) costs across Brazilian municipalities, contributing to a more efficient and transparent allocation of resources within the Unified Health System (SUS). Data from Datasus covering the period from 2022 to July 2024 were used, after preprocessing and standardization. Different predictive models were evaluated—Decision Tree, Random Forest, and Multi-Layer Perceptron (MLP)—using average hospitalization cost, length of hospital stay, and number of deaths as input variables, and predicting the average hospitalization cost per municipality as the output. The MLP model achieved the best performance, with a MAPE of 28.46% and an MAE of 183.20. Comparing predicted and observed values enabled the identification of potential underfunding or over-allocation of resources, highlighting the potential of machine learning as a decision-support tool for budget planning and evidence-based public policymaking..
KEY-WORDS: Normalization; Scientific Writing; REPA; Template;
A gestão dos recursos na saúde representa um desafio contínuo para as administrações públicas em todo o mundo. No Brasil, o Sistema Único de Saúde (SUS), instituído pela Constituição Federal de 1988 e regulamentado pela Lei Orgânica da Saúde (Lei nº 8.080/1990), foi concebido em resposta à necessidade de universalizar o acesso à saúde pública, estabelecendo como um direito de todos e um dever do Estado, art. 196 [1], para garantir a integralidade, a equidade e a descentralização dos serviços médico-hospitalares e laboratoriais à população.
Sendo inteiramente financiado pelo orçamento público, o modelo de gestão do SUS enfrenta obstáculos quanto à busca pela eficiência e na forma de planejar adequadamente a saúde, em virtude da descentralização das ações nos estados e municípios.
Essa proposição exige maior empenho desses entes públicos no processo de negociação, na ampliação da oferta de serviços, na capacidade de agir, na interlocução e na organização da rede de serviços com base na referência e contrarreferência. Todos os aspectos referidos têm implicações para a gestão em saúde [2].
Da mesma forma que a transição demográfica e epidemiológica enfrentada pelo Brasil, marcada pelo envelhecimento populacional e pela mudança no perfil das doenças, tem colocado uma pressão cada vez maior sobre o SUS. É possível pontuar que, simultaneamente, as políticas de equilíbrio e de cortes nos investimentos afetaram diretamente os princípios de universalidade e igualdade do sistema, limitando a capacidade de atendimento e a qualidade dos serviços oferecidos [3].
Observa-se que, não obstante às questões econômicas, políticas e sociais que têm influenciado a constituição do SUS, as mudanças profundas e rápidas da população brasileira, assinaladas por uma transição epidemiológica e uma transição demográfica, colocaram uma grande carga sobre o sistema de saúde e de cuidados de longo prazo [4], desafiando a alocação de recursos do orçamento público. Esse tipo de situação pode ser amplamente estudado com o uso de métodos computacionais que permitam identificar padrões complexos e antecipar necessidades.
É no contexto apresentado que se alicerça o problema de pesquisa: como o aprendizado de máquina pode apoiar os gestores na avaliação dos custos com a assistência hospitalar dos municípios no Sistema Único de Saúde (SUS)?
A presente questão poderá ser capaz de favorecer a alocação e a gestão de recursos hospitalares frente aos desafios orçamentários e na busca por melhores indicadores assistenciais nas estratégias de saúde pública hospitalar, apoiando os gestores na avaliação dos custos na Assistência de Internação Hospitalar (AIH) do SUS.
Para alcançar o objetivo proposto, foram definidos os seguintes objetivos específicos:
· Coletar os dados históricos mensais, do período de 2022 a 2024, sobre as AIH e a aplicação de recursos no SUS;
· Treinar e comparar modelos de aprendizado de máquina capazes de identificar padrões de gastos e prever os recursos públicos aplicados na AIH;
· Avaliar a melhor alternativa para analisar divergências entre a predição e a aplicação dos custos médios das internações hospitalares por município.
Para entender melhor o cenário descentralizado da saúde pública brasileira, o presente estudo analisa os dados abertos municipais sobre os gastos com a Assistência de Internação Hospitalar (AIH) da ampla rede de hospitais públicos e privados vinculados ao SUS. Justifica-se explorar o aprendizado de máquina para apoiar gestores da saúde na análise de grandes volumes de dados, identificação de padrões, redução de incertezas e predições para decisões objetivas, superando métodos tradicionais e Business Intelligence.
Apesar dos avanços na infraestrutura hospitalar e nas políticas públicas assistenciais, persiste ainda uma lacuna entre a alocação de recursos e os resultados assistenciais, especialmente em municípios com menor cobertura de Atenção Primária à Saúde (APS) [5].
Nos dados de AIH, tem-se a taxa de mortalidade hospitalar no Brasil como um dos indicadores de resultado assistencial. Segundo o Datasus, em 2023, a taxa de mortalidade foi de 4,45%, variando entre regiões: Norte (2,94%), Nordeste (3,95%), Sudeste (5,28%), Sul (4,54%) e Centro-Oeste (3,50%) [6]. Explorar as relações entre os indicadores assistenciais e os recursos aplicados poderá oferecer melhor qualidade informacional para os gestores do SUS.
A Assistência de Internação Hospitalar (AIH) no SUS inclui hospitais públicos e privados conveniados, sendo gerida por gestores federais, estaduais e municipais que supervisionam redes hospitalares e autorizam as AIH [6].
As AIH têm um papel estratégico na sustentabilidade da administração pública, sendo estudadas como objeto de aprendizado de máquina para impulsionar inovações no gerenciamento de dados hospitalares. As internações são financiadas principalmente pelo teto MAC, recursos federais transferidos automaticamente para os fundos de saúde estaduais, municipais e do Distrito Federal [7]. E Cerca de 10% das transferências de MAC, referentes a procedimentos estratégicos, são financiados pelo Faec, com recursos repassados após apuração local para pagamento dos prestadores [7].
Para análise do comportamento e a predição dos dados contínuos deste estudo, é importante conceituar os métodos de regressão utilizados na elaboração dos algoritmos. Os Tipos Utilizados de Modelos de Aprendizado de Máquina são: o Decision Tree, o Random Forest, o SVC, o KNN e o MLP.
Considera-se que o Decision Tree é um algoritmo de aprendizado supervisionado que pode ser utilizado tanto para classificação quanto para regressão. Ele funciona dividindo iterativamente o conjunto de dados em subconjuntos baseados nas características mais significativas, criando uma estrutura em formato de árvore [8]. Cada nó interno representa uma decisão com base em uma variável, e cada folha representa a previsão final. No caso de regressão, a árvore tenta prever valores contínuos, ajustando-se aos dados de forma hierárquica.
Um dos principais benefícios do Decision Tree é a sua simplicidade e esclarecimento, apesar de estar sujeito ao sobreajuste, especialmente em dados ruidosos [8; 10].
O Random Forest é um algoritmo de aprendizado supervisionado baseado em um conjunto de árvores de decisão. Pode-se afirmar que ele opera construindo diversas árvores durante o treinamento e, para predições, combina os resultados dessas árvores, seja por votação (classificação) ou pela média dos valores preditos (regressão). Uma característica pertinente do Random Forest é sua capacidade de evitar o sobreajuste, uma vez que o modelo é formado por várias árvores, cada uma treinada em subconjuntos distintos dos dados [8].
Sobre o Support Vector Classification (SVC), ele é uma variante do algoritmo de máquinas de vetores de suporte (SVM) utilizado para tarefas de classificação [9]. O SVC é eficaz em cenários onde as classes não são linearmente separáveis, utilizando técnicas de kernel para transformar os dados em um espaço dimensional mais alto, onde a separação seja possível. Em consequência, a premissa básica do SVC é encontrar um hiperplano que melhor separe os dados das diferentes classes, maximizando a margem entre os pontos de diferentes categorias.
Por outra perspectiva, tem-se o K-Nearest Neighbors (KNN) como algoritmo de aprendizado supervisionado que faz previsões baseadas na proximidade de uma amostra em relação a outras no conjunto de dados.
Para regressão, o KNN calcula a média dos valores de seus "K" vizinhos mais próximos para fazer uma estimativa. É um algoritmo simples e intuitivo, cuja precisão depende significativamente da escolha adequada de "K" e da métrica de distância utilizada (como a distância Euclidiana). Apesar de ser computacionalmente intensivo em grandes conjuntos de dados, o KNN pode ser altamente eficaz nas situações em que a relação entre as variáveis é complexa e não linear [9].
Para resolver alguns problemas mais complexos são necessárias por vezes utilizar redes de Perceptrons organizadas em múltiplas camadas, definidas como MLP (Multi-Layer Perceptrons). O MLP é uma rede do tipo Perceptron com pelo menos uma camada intermediária e o seu treinamento foi feito originalmente utilizando-se um algoritmo denominado retropropagação do erro, conhecido como backpropagation [9].
Esse algoritmo consiste basicamente em dois passos: 1) propagação positiva do sinal funcional, durante a qual todos os pesos da rede são mantidos fixos; e 2) retropropagação do erro, durante a qual os pesos da rede são ajustados com base no erro. O Quadro 1 resume as características e as definições dos algoritmos de regressão abordados.
Quadro 1 - Características dos algoritmos.
|
Modelo |
Vantagem |
Desvantagem |
Aplicação |
|
Decision Tree (Árvore de Decisão) |
Fácil de interpretar, não precisa de muita preparação dos dados |
Sujeito a sobreajuste, especialmente em dados ruidosos |
Previsão de dados com baixa complexidade |
|
Random Forest (Conjunto de Árvores de Decisão) |
Robustez contra sobreajuste, boa precisão em dados complexos |
Modelo mais lento e menos interpretável |
Previsão de preços, análise de risco |
|
SVC (Modelos Baseados em Vetores de Suporte) |
Eficaz em separação não linear, bom desempenho em alta dimensionalidade |
Sensível à escolha do kernel e dos parâmetros, pode ser lento |
Previsão de valores de mercado, análise de dados financeiros |
|
KNN (Baseado em Vizinhos Próximos) |
Simplicidade, fácil de entender e implementar. |
Computacionalmente caro, sensível a ruídos e ao valor de "K". |
Análise de tendências, predição de valores contínuos com base em padrões |
|
MLP (Perceptron de múltiplas camadas) |
Capacidade de resolver problemas mais complexos e com redes de múltiplas camadas. |
Processo desconhecido de ajustes de pesos durante o treinamento. |
Resolver problemas não lineares com algoritmo de treinamento mais sofisticado e capaz de definir de forma automática os pesos. |
Fonte: os autores.
Cada algoritmo, Quadro 1, diferencia-se em termos de funcionamento, vantagens e desvantagens, além das suas áreas de aplicação.
Diversos estudos avaliam a eficiência dos gastos em saúde e a alocação de recursos no SUS e em contextos internacionais. [5] analisaram a APS no Brasil (2008-2019) e identificaram que, apesar do aumento nos gastos per capita e na cobertura, os resultados em mortalidade e hospitalizações variaram com o tamanho populacional e as condições socioeconômicas.
[11] discutiu a incerteza nos custos e benefícios em saúde, destacando a importância de avaliações de eficiência para apoiar decisões. Baseada em benchmarking e indicadores, essa abordagem pode melhorar a gestão hospitalar, revelando boas práticas e orientando tecnologias e processos mais eficazes.
[12] analisaram a eficiência dos gastos públicos em saúde nos 27 estados brasileiros usando a Análise Envoltória de Dados (DEA). Apenas o Maranhão foi eficiente de 2005 a 2014. O estudo revelou que, apesar do aumento nos investimentos, a maioria dos estados teve desempenho insatisfatório em indicadores como vacinação, atenção básica e internações, apontando alocação ineficiente de recursos.
Enquanto [13] introduziu o uso de inteligência artificial (IA) para auditoria contínua de lançamentos contábeis em saúde e educação. Usando modelos tradicionais de aprendizado de máquina e o modelo profundo BERTimbau, o estudo destacou a eficácia da IA na identificação de irregularidades, com maior precisão e eficiência no monitoramento de despesas públicas.
O Quadro 2 resume as ideias centrais e o potencial de técnicas utilizadas pelos autores.
Quadro 2 – Trabalhos Relacionados. Resumo das principais ideias sobre avaliação de recursos na saúde.
|
Autores |
Ideia Central |
Técnica/ Modelo |
|
Santos, Silva, Benevides & Servo (2023) [7] |
Analisar as variações dos valores financiados pelo governo federal para internações no SUS, em 2019, segundo os procedimentos registrados no Sistema de Informações Hospitalares (SIH). |
Software IBM SPSS Statistics 2.0; Medidas de tendência central e estatística descritiva (totais, percentuais, médias e medianas, dispersão, desvio-padrão e coeficientes de variação). |
|
Ocké-Reis et al. (2023) [11] |
Discutir sobre incertezas em saúde e a importância da avaliação de eficiência para reduzir essas incertezas e melhorar a gestão. |
Benchmarking e monitoramento de indicadores |
|
Andrett et al. (2018) [12] |
Avaliar a eficiência dos gastos públicos em saúde nos estados brasileiros entre 2005 e 2014. |
Análise Envoltória de Dados (DEA) |
|
Pinto et al. (2023) [13] |
Uso de IA para auditoria contínua em lançamentos contábeis na saúde e educação públicas. |
Regressão Logística, SVM, k-NN, Naive Bayes, aprendizado profunda de máquina (BERTimbau) |
|
Valle-Cruz et al. (2022) [14] |
Investigar o uso de IA para melhorar a alocação de orçamentos públicos, analisando o impacto econômico e social em 217 países. |
Perceptron multicamada e algoritmo genético multiobjetivo |
Fonte: os autores.
O Quadro 2 trouxe um resumo das ideias apresentadas pelos estudos levantados e inspirou uma compreensão inicial sobre os métodos e o problema deste trabalho.
Ao avaliar os métodos de aprendizado de máquina para analisar os custos médios de internação por município, este estudo utilizará dados de AIH do Datasus, a partir dos referidos indicadores de resultado como taxa de mortalidade, óbitos, dias e média de permanência hospitalar, quantidade de internações e os valores aplicados nas respectivas internações. Não serão tratados aspectos como atenção básica, atendimentos ambulatoriais, doenças específicas ou políticas federais de saúde.
Os treinamentos usaram dados específicos do Sistema de Informações Hospitalares (SIH) do Datasus, e foram utilizados apenas algoritmos de regressão, excluindo técnicas como associação, clusterização e classificação. Redes neurais profundas e aprendizado não supervisionado foram excluídos por limitações de infraestrutura e dados.
Os resultados são direcionados a gestores estratégicos, focando na alocação de recursos e indicadores assistenciais.
3.1 O TABNET do DATASUS
Entende-se o Tabnet como um portal de dados abertos provenientes do Sistema de Informações Hospitalares do SUS (SIH/SUS), geridos pelo Departamento de Informática do SUS (Datasus), órgão vinculado à Secretaria Executiva do Ministério da Saúde, e alimentados diariamente pela rede credenciada do SUS nos municípios de cada estado.
Segundo o portal do Ministério da Saúde [6], o SIH/SUS coleta mais de 50 variáveis relativas às internações, que identifica e qualifica, por exemplo, os pacientes, os procedimentos, os exames, os atos médicos realizados e os diagnósticos.
3.2 DESCRIÇÃO DA BASE DE DADOS
Apesar de algumas limitações referentes à disponibilidade dos dados, foi coletado inicialmente 17 features, mas, ao final do pré-processamento dos dados, permaneceram oito features, conforme Quadro 3.
Quadro 3 – Descrição dos atributos. Resumo das variáveis do dataset.
|
Nome do atributo |
Descrição do atributo |
Tipo |
Domínio |
|
Nome do município com internações hospitalares realizadas ou registradas |
Localidade |
Strings compostas por caracteres alfabéticos |
|
|
Internações |
Quantidade de internações do período |
Quantidade |
Números inteiros não negativos |
|
Valor_Total |
Valor monetário pago |
Valor Monetário |
Números reais não negativos |
|
Valor_ Médio_ Internação |
Média do valor pago por cada internação realizada |
Valor Monetário |
Números reais não negativos |
|
Dias_ Permanência |
Número total de dias em que os pacientes permaneceram internados |
Quantidade |
Números inteiros não negativos |
|
Média_ Permanência |
Média de dias dos pacientes permaneceram internados |
Quantidade proporcional |
Números reais não negativos |
|
Óbitos |
Número total de óbitos ocorridos durante as internações |
Quantidade |
Números inteiros não negativos |
|
Taxa_ Mortalidade |
Porcentagem de óbitos em relação ao número total de internações |
Percentual |
Números reais entre 0 e 100 |
Fonte: os autores.
As demais features foram excluídas pela baixa significância estatística ou pouca explicação teórica com o estudo.
3.3 ANÁLISE DESCRITIVA DOS DADOS
Nesta seção foram realizadas etapas da análise descritiva do dataset, Tabela 1: a média, o máximo e mínimo, a mediana e os quartis, bem como a verificação de valores faltantes na amostra.
Tabela 1 - Análise descritiva das variáveis.
|
|
Valor_médio_ intern |
Dias_ permanência |
Óbitos |
|
92.446 |
92.446 |
92.446 |
|
|
Mean |
687,01 |
1.879,16 |
16,81 |
|
Std |
596,80 |
10.341,81 |
83,38 |
|
Min |
43,26 |
0,00 |
0,00 |
|
25% |
395,21 |
94,00 |
0,00 |
|
50% |
482,50 |
254,00 |
2,00 |
|
75% |
689,01 |
801,00 |
8,00 |
|
Max |
19.750,15 |
359.311,00 |
3.548,00 |
Fonte: Os autores.
A partir dos dados estatísticos da Tabela 1 foi plotado um gráfico de boxplot, Figura 1, referindo-se à distribuição dos 3165 municípios a partir dos valores médios de internação registrados. Destaca-se a baixa amplitude interquartil no boxplot, o que significa maior concentração dos dados em torno da mediana, R$ 482,50, no período.
Figura 1 –Distribuição dos valores médios de AIH
Fonte: os autores.
Na Figura 1, o limite máximo e mínimo dos quartis consistem nos valores de R$ 1.129,73 e R$ 43,26, respectivamente, onde estão concentrados a maior parte dos dados observados. Sobretudo, os outliers representam aqueles grupos de municípios que possuem valores acima do limite do último quartil (valor R$ 1.129,73). Pode-se destacar, entre eles, que o município de Jaci-SP apresentou o maior valor de custo médio, de R$ 19.750,15.
Já no Quadro 4 está descrita a frequência com que os municípios aparecem no dataset, na medida em que executam os recursos orçamentários com AIH. Dentro do período de janeiro de 2022 a julho de 2024, o máximo de vezes em que cada município está presente na base de dados variou entre 01 e 31 meses.
Quadro 4 – Frequência dos municípios no período de janeiro de 2022 a julho de 2024.
|
|
Município |
Frequência |
|
1 |
Alta Floresta D'oeste |
31 |
|
2 |
Buritama |
31 |
|
3 |
Barra Bonita |
31 |
|
4 |
Barretos |
31 |
|
5 |
Barueri |
31 |
|
... |
... |
... |
|
3161 |
São Joao D'alianca |
1 |
|
3162 |
Juquitiba |
1 |
|
3163 |
Tibau |
1 |
|
3164 |
Avelino Lopes |
1 |
|
3165 |
Cafelândia-PR |
1 |
Fonte: os autores.
Pode-se constatar no Quadro 4 que o recebimento de recursos pelos municípios não é regular para todos, podendo mudar a cada mês. Na Figura 2, o gráfico mostra a quantidade de municípios pelas faixas de frequência no dataset.
Figura 2 –Distribuição da Frequência dos Municípios
Fonte: os autores.
Do total de 5.570 municípios brasileiros, pelo IBGE, apenas 3.165 foram identificados no dataset como recebedores de recursos em AIH, dentre eles, a maior concentração (2.456 municípios) está na faixa de regularidade, com 31 ocorrências. O gráfico da Figura 3 compara os dez municípios com maiores valores registrados em único mês para o custo médio de internação.
Figura 3 – Gráficos de Barras. Distribuição dos
valores médios de AIH e frequência dos municípios
Fonte: os autores.
É possível identificar uma diferença significativa entre os municípios, (20º Bom Jesus do Itabapoana (R$ 8.333,29) e do 1º Jaci (R$ 19.750,15). Fica ainda mais evidente quando comparado com a mediana de R$ 482,50.
Quanto à Figura 4, o gráfico apresenta a evolução anual do custo médio de internação acumulado entre os 10 municípios com maiores valores registrados, sendo eles: Bezerros, Bom Jesus de Itabapoana, Charqueadas, Guaiba, Itaperuna, Jaci, Remanso, Santa Rita (PB), Timbaúba e Trombudo Central. Importante ressaltar a evidência de que o tamanho do munícipio não é condição para obter maior custo médio de internação.
Figura 4 – Evolução anual do custo médio de internação.
Fonte: os autores.
A Figura 4 destaca a tendência de alta do município de Santa Rita, do estado da Paraíba, finalizando a trajetória como maior valor em 2024, ultrapassando inclusive o município de Jaci, do estado de São Paulo, que obteve os maiores custos de internação hospitalar da série histórica entre 2022 e 2023.
3.4 PRÉ-PROCESSAMENTO DOS DADOS
O pré-processamento dos dados foi realizado através das etapas resumidas na Figura 5.
Figura 5 – Fluxograma. Pré-processamento de dados.
Fonte: os autores.
Essas etapas podem ser detalhadas como:
1) Concatenação dos datasets: pelo volume de datasets, houve a necessidade de consolidar os dados em um único dataset, em csv. Foram coletados dados mensais dos exercícios de 2022, 2023 e 2024 (julho), no Datasus [6];
2) Troca de caracteres: onde constava o caractere “-“(travessão), foi substituído por zero, conforme orientação no Tabnet [6];
3) Limpeza dos dados: nessa etapa optou-se por excluir alguns dados categóricos (textuais) e outros duplicados, de modo a não comprometer o número de observações e as respectivas análises;
4) Verificação de valores inexistentes: foi processada a análise de lacunas nos campos por meio de algoritmos;
5) Descrição estatística do dataset: após a limpeza, foram executadas as análises estatísticas;
6) Geração da matriz de correlação (Figura 6): inicialmente com oito features, mas manteve-se as três features com maior relevância teórica e estatística, conforme os dados da matriz, para treinar os modelos de aprendizado de máquina.
Figura 6 – Matriz de Correlação de Spearman entre as variáveis.
Fonte: os autores.
A metodologia adotada para conduzir o experimento deste estudo baseou-se no modelo do CRISP-DM (Cross-Industry Standard Process for Data Mining), que é amplamente aplicado em projetos de mineração de dados e aprendizado de máquina. O CRISP-DM é um processo padrão de indústria para exploração de dados composto por seis fases, Figura 7: 1. Entendimento do Negócio; 2. Entendimento dos Dados; 3. Preparação dos Dados; 4. Modelagem; 5. Avaliação; 6. Implantação. Shearer (2000) apud [10].
Figura 7 – Diagrama do CRISP-DM. Apresentação das etapas e fluxo do processo do CRISP-DM.
Fonte: [10].
Considerou-se como primeira etapa do CRISP-DM, caracterizada como entendimento do negócio da Figura 7, a aplicação de recursos públicos em AIH no SUS, cujos dados e variáveis foram extraídas da base do Tabnet/Datasus, do Ministério da Saúde.
Após a definição da metodologia CRISP-DM e dos modelos de aprendizado de máquina, é importante escolher as métricas de erro apropriadas para avaliar os resultados desses modelos.
As métricas de erro apontam o quanto bem (ou mal) um modelo está desempenhando a função de comparar as previsões geradas com os valores reais. Essa escolha da métrica depende do tipo de problema em questão, se regressão ou classificação. Para este trabalho, considerou-se como um problema de regressão e utilizou-se o MAPE e o MAE.
O erro percentual absoluto médio (MAPE - Mean Absolute Percentage Error) [17] é uma métrica amplamente utilizada para medir o erro médio em termos percentuais, facilitando a comparação entre diferentes modelos, especialmente quando lida com dados em escalas variadas. O MAPE é calculado como a média das diferenças absolutas entre os valores reais e os valores previstos, divididas pelos valores reais, sendo então multiplicado por 100 para expressar o resultado em porcentagem. A equação do MAPE (4) pode ser expressa da seguinte maneira:
MAPE = 100 ∑n i=1 |Yi - Y’|
n
onde Yi representa o valor real e Y’i o valor previsto para o i-ésimo dado.
Uma das principais vantagens do MAPE é sua fácil interpretação, uma vez que ele fornece o erro médio em termos percentuais, sendo útil para a comparação entre modelos que lidam com variáveis de diferentes escalas. Entretanto, o MAPE apresenta algumas desvantagens, principalmente quando os valores reais são próximos de zero, o que pode resultar em distorções significativas e exagerar o erro percentual.
Por
esse motivo, é importante estar ciente das limitações da métrica, especialmente
em conjuntos de dados que apresentam valores reais muito baixos ou nulos. Por
outro lado, o erro médio absoluto (MAE) [17] é uma métrica utilizada para avaliar o desempenho de modelos
de regressão em machine learning,
Ela mensura a média da diferença absoluta entre os valores previstos pelo modelo e os valores observados, através da expressão (5).
Os modelos de regressão utilizados inicialmente para treinamento foram o Random Forest, o SVC, o KNN, o Decision Tree e o MLP. Dentre eles, apenas três tiveram melhores desempenhos ao problema proposto: o Decision Tree, o Random Forest e o MLP
Foram realizadas duas etapas: I) busca por melhores hiperparâmetros; e II) avaliação dos modelos no conjunto de testes, sendo esta última etapa decisiva para a escolha do modelo de regressão para este trabalho.
Para a regressão, as features “valor médio de internação”, “dias de permanência hospitalar” e “óbitos” foram selecionadas. Como atributo de saída da regressão, o treinamento da máquina procurou entender o comportamento do “valor (R$) médio de internação” dos municípios por ano analisado (2022, 2023 e 2024), com base nas características apresentadas pelos demais atributos. Esse conjunto de testes gerou os valores na Tabela 2:
Tabela 2- Análise das variáveis.
|
Avaliação no conjunto de teste |
|||
|
Métodos |
Random Forest |
Decision Tree |
MLP |
|
MAPE |
32.145% |
34,557% |
28.345% |
|
MAE |
194.549 |
216.191 |
183.076 |
Fonte: os autores.
O MLP apresentou os melhores resultados sobre o conjunto de testes realizados. Isso significa que a regressão baseada no Multi-layer Perceptron, dentre os demais modelos, ofereceu as melhores condições de resposta à base de dados do Datasus, referente às AIH, conseguindo aprender de forma mais eficaz ao realizar processo de ajustes automáticos dos pesos durante o treinamento, resultando em menores erros médios percentual (MAPE) e absoluto (MAE) nas predições, 28,456% e 183,204, respectivamente. Essa média dos regressores por município e por ano analisados.
Para ilustrar essa curva de aprendizado do MLP, utiliza-se a função de perda (MAE) na Figura 8, que detalha o comportamento do treino e da validação do modelo.
Figura 8 – Função de perda do MAE, comparando-se o treino e a validação do modelo MLP.
Fonte: os autores.
Pode-se observar, na Figura 8, que o comportamento dos gráficos de erro médio no treinamento e na validação do modelo diminui de forma acentuada nas primeiras épocas e atinge uma condição de estabilidade no avançar das épocas, obtendo os menores erros a partir da época 60.
Com os achados apresentados nesta seção, entende-se que o MLP surge como a melhor alternativa de aprendizado de máquina para responder ao objetivo deste trabalho.
Sobre o modelo de regressão MLP adotado neste estudo, é uma rede neural feedforward, implementada com o algoritmo MLP Regressor da biblioteca scikit-learn. Sua arquitetura (Figura 9) compreende uma camada de entrada formada pelos atributos quantitativos selecionados, camadas ocultas e uma camada de saída única:
• Camada de entrada: atributos padronizados (ex.: média de permanência, óbitos, valor médio de internação, etc.);
• Camadas ocultas: blocos representando neurônios totalmente conectados, com indicação de funções de ativação não lineares;
• Camada de saída: um único neurônio representando a previsão do valor total ou médio das internações.
Figura 9 - Gráfico de Densidade. Distribuição dos erros entre valores reais e previstos
Fonte: os autores.
Os dados foram padronizados com StandardScaler (ferramenta que padroniza as features, o que é crucial para algoritmos sensíveis à escala, para garantir que todas as variáveis contribuam igualmente) assegurando estabilidade numérica e melhor convergência.
A definição da arquitetura e dos hiperparâmetros foi realizada por meio do RandomizedSearchCV, com treinamento baseado em retropropagação do erro e uso de early stopping para evitar overfitting (sobreajuste) em modelos iterativos, como redes neurais. O modelo apresentou capacidade robusta de capturar padrões complexos nos dados do Datasus, reduzindo erros de previsão.
Observa-se na Figura 10 que a distribuição dos erros concentra-se em relação à mediana, que é zero, e divide o cenário dos dados no gráfico.
Figura 10 – Gráfico de Densidade. Distribuição dos erros entre valores reais e previstos.
Fonte: os autores.
O erro apresentado no gráfico considera a diferença entre o valor real das observações e o valor previsto pela regressão. Com isso, houve uma elevada densidade dos erros na área próxima ao valor zero, representando uma distribuição normalizada. Constata-se o bom aprendizado do modelo MLP com os dados do treinamento.
Um fato importante sobre as observações que estão fora da área central de distribuição, os outliers, é a tendência maior a essas observações apresentarem erros maiores que zero, ou seja, a diferença entre os valores reais e os valores previstos tendem a ser mais positiva do que negativa.
Definido o melhor modelo de aprendizado de máquina na seção anterior, o MLP, cabe agora aplicar os resultados da regressão ao contexto de avaliação da realidade dos custos médios com AIH nos municípios, conforme proposto no objetivo deste estudo.
Foram escolhidos aleatoriamente cinco municípios brasileiros, Figura 11, definidos previamente como capitais, cuja amostra foi representada por Brasília-DF, Recife-PE, Vitória-ES, São Paulo-SP e Curitiba-PR.
Figura 11 – Gráfico de Barras. Consulta geral dos custos médios de internação dos municípios para comparação.
Fonte: os autores.
No gráfico da Figura 11 é possível filtrar individualmente o município ou o conjunto de municípios para comparação dos custos médios (real e estimado) das internações hospitalares, como numa fotografia sobre a situação atual do ente federativo.
Ao comparar o valor médio previsto com o valor real dos municípios, obtém-se uma ferramenta gerencial capaz de apoiar decisões de gestores da saúde estadual e federal com parâmetros objetivos sobre a alocação de recursos para AIH, além de proporcionar subsídios para medidas de controle que busquem maximizar a eficiência desses gastos.
Nos exemplos da Figura 11, as cidades de Brasília, Vitória e São Paulo possuem os custos médios reais inferiores aos valores previstos. Essa diferença pode indicar, em média, a existência de subfinanciamento ou uma possível economia dos custos com AIH nesses locais. Já em Recife, em contraponto, apresentou valor médio de internação real superior ao valor previsto, sugerindo a possibilidade de uma lógica inversa dos exemplos anteriores, com a aplicação de recursos de financiamento das AIH acima da expectativa.
Com essas informações de regressão geradas pelo aprendizado de máquina, os gestores (usuários da informação) possuem alternativas de avaliá-las a partir dos seguintes focos:
· Local: com a possibilidade avaliar os municípios como centros de custos de internação hospitalar;
· Estadual: possibilitando comparar informações dos municípios sediados em determinado estado, priorizando a distribuição mais equitativa dos recursos em AIH/SUS e ações de melhorias dos gastos;
· Regional/Nacional: para gestores do Ministério da Saúde e unidades vinculadas, as informações servem de parâmetro para o planejamento regional das metas, estratégias e do orçamento em políticas públicas voltadas à assistência de internação hospitalar (AIH).
4.3 LIMITAÇÕES DE PESQUISA
O modelo utilizou dados públicos sobre as AIH disponíveis no Datasus, servindo apenas como base para a geração indicadores inteligentes de monitoramento. Logo, é relevante destacar que as interpretações da seção 4.2 são apenas possibilidades de apoio às decisões gerenciais correlacionadas às diferenças encontradas entre os custos reais e os previstos, não cabendo a este estudo extrapolar às limitações metodológicas de avaliar municípios quanto à eficiência e ineficiência, ou regularidade e irregularidade dos gastos em AIH.
Esse tipo de avaliação cabe exclusivamente aos órgãos de controle e de auditoria governamentais, com a função de compreender os cenários envolvidos dos gastos desses entes públicos, bem como as decisões por uma investigação caso a caso sobre causas dos resultados avaliados.
Sobre a limitação dos dados de AIH disponíveis no SIH/Datasus, diversos fatores que impactam os valores das features, como óbitos e dias de permanência hospitalares, não estão mensurados na base de dados, logo podem limitar a explicação dos atributos utilizados e refletir sobre o treinamento do modelo MLP. Cabe expandir a base de dados e integrar novos atributos para trazer maior robustez ao modelo.
5 CONCLUSÕES
O presente artigo trouxe como objetivo responder como o aprendizado de máquina pode apoiar os gestores na avaliação dos custos com a assistência hospitalar dos municípios no Sistema Único de Saúde (SUS). Para alcançá-lo, foi proposto realizar coleta de dados históricos, do período de janeiro de 2022 a julho de 2024, para treinar dos modelos de aprendizado de máquina e avaliar a melhor alternativa para os gestores conseguirem analisar os custos médios das internações hospitalares por município.
Como metodologia, dentre os cinco modelos de algoritmos de regressão pré-selecionados: Random Forest, SVC, KNN, Decision Tree e MLP, apenas três tiveram melhores desempenhos ao problema proposto: o Decision Tree, o Random Forest e o MLP. No segundo momento, ao compará-los, o MLP foi selecionado por apresentar os melhores resultados no treinamento, ou seja, a decisão foi baseada pelos menores valores de comportamento dos erros: o MAPE de 28,456% e o MAE de 183,204.
Com o modelo de aprendizado de máquina definido, foi possível analisar os custos médios de internação hospitalar com a amostra de cinco capitais escolhidas aleatoriamente: Brasília, Vitória, São Paulo, Recife e Curitiba, comparando os custos reais e os custos previstos de internação gerados pela regressão.
Dessa forma, é possível concluir que o presente estudo atingiu ao objetivo proposto. A partir do método de aprendizagem de máquina escolhido, o MLP (Multi-layer Perceptron), pode-se discutir gerencialmente, a partir dos dados históricos dos custos com as AIH/SUS por município, sobre critérios objetivos e priorização eficiente de alocações dos recursos hospitalares aos municípios, bem como as ações de controle para melhorias dos gastos.
Foi possível analisar individualmente ou conjuntamente os municípios, permitindo ao gestor (usuário da informação) realizar avaliações sobre os centros de custos municipais ou tomar decisões quanto à equidade das distribuições de recursos orçamentários para políticas de AIH, bem como é viável extrair informações para o planejamento e as estratégias regionais das políticas públicas de assistência hospitalar do SUS, buscando-se compreender os impactos sob a perspectiva de financiamento ou de eficiência dos gastos.
Como sugestão de futuras pesquisas:
1) Replicar o presente estudo com ampliação na base de dados assistenciais ou de políticas públicas do SUS;
2) Desenvolver conceito de orçamento inteligente para aplicação pelos gestores na alocação de recursos para a saúde pública.
REFERÊNCIAS
[1] BRASIL. Constituição da República Federativa do Brasil. Brasília: Congresso Nacional, 1988.
[2] SANTOS, Thadeu Borges Souza et al. Gestão hospitalar no Sistema Único de Saúde: problemáticas de estudos em política, planejamento e gestão em saúde. Ciência & Saúde Coletiva, v. 25, p. 3597-3609, 2020.
[3] CAMPOS, Celia Maria Sivalli; VIANA, Nildo; SOARES, Cassia Baldini. Transformations in contemporaneous capitalism and its impact on state policies: the SUS in debate. Saúde e Sociedade, v. 24, p. 82-91, 2015.
[4] ORTIZ, Bruna Maria Limeira Rodrigues et al. Tecendo uma análise sobre a atenção domiciliar no Sistema Único de Saúde. 2017.
[5] BARROS, Rafael Damasceno de; AQUINO, Rosana; SOUZA, Luis Eugênio Portela Fernandes. Evolution of the structure and results of Primary Health Care in Brazil between 2008 and 2019. Ciência & Saúde Coletiva, v. 27, p. 4289-4301, 2022.
[6] BRASIL, Datasus. Informações de Saúde (TABNET). Ministério da Saúde. 2019.
[7] SANTOS, Maria Angelica Borges et al. A remuneração de internações e a tabela de procedimentos do SUS: Uma análise a partir do SIH e SIGTAP. Texto para Discussão, 2023.
[8] GRUS, Joel. Data science do zero. Rio de Janeiro: Alta books, 2016.
[9] CASTRO, Leandro Nunes de; FERRARI, Daniel Gomes. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. Saraiva Educação SA, 2016.
[10] PROVOST, Foster; FAWCETT, Tom. Data Science para negócios. Alta Books, 2016.
[11] OCKÉ-REIS, Carlos Octávio Organizador et al. SUS: avaliação da eficiência do gasto público em saúde. 2023.
[12] ANDRETT, Marcia et al. Eficiência dos gastos públicos em saúde no Brasil: estudo sobre o desempenho de estados brasileiros. Revista de Gestão em Sistemas de Saúde, v. 7, n. 2, p. 114-128, 2018.
[13] PINTO, Rafael Maia et al. Detecção de erros e fraudes em gastos públicos nas áreas da saúde e educação: uma abordagem utilizando inteligência artificial. 2023.
[14] VALLE-CRUZ, David; FERNANDEZ-CORTEZ, Vanessa; GIL-GARCIA, J. Ramon. From E-budgeting to smart budgeting: Exploring the potential of artificial intelligence in government decision-making for resource allocation. Government Information Quarterly, v. 39, n. 2, p. 101644, 2022.
[15] ALATAWI, Ahmed D.; NIESSEN, Louis Wilhelmus; KHAN, Jahangir AM. Efficiency evaluation of public hospitals in Saudi Arabia: an application of data envelopment analysis. BMJ open, v. 10, n. 1, p. e031924, 2020.
[16] WORLD HEALTH ORGANIZATION et al. Public spending on health: a closer look at global trends. World Health Organization, 2018.
[17] HYNDMAN, Rob J.; ATHANASOPOULOS, George.
Forecasting: Principles and Practice. 3a ed. Monash University, Australia.