Treinamento de um Modelo de Reconhecimento de Entidades Nomeadas (NER) para Identificação de Vacinas
##plugins.themes.bootstrap3.article.main##
Resumo
O histórico do Brasil em relação à implantação da vacina como medida de profilaxia resultou na erradicação de doenças imunopreveníveis (Fernandes et al., 2021). Diante disso, torna-se crucial aplicar novas técnicas para aprimorar e desenvolver soluções tecnológicas, levando em consideração as características e informações específicas do contexto brasileiro. No site do Ministério da Saúde, há diversas informações sobre vacinas, incluindo calendários de vacinação e manuais que contêm detalhes sobre aplicações, restrições e particularidades (Ministério da Saúde, 2024). Dado o volume de informações, é imprescindível o uso de técnicas e ferramentas capazes de tratar e filtrar esses dados de maneira eficaz. O Processamento de Linguagem Natural (PLN) é uma área da Inteligência Artificial que visa aproximar a compreensão e a geração de texto por máquinas à linguagem humana. Dentro do PLN, existem diversas técnicas com diferentes objetivos, entre elas a Named Entity Recognition (NER), usada em pipelines para identificar e classificar entidades de um texto em categorias definidas (Pereira, 2024). O objetivo central é facilitar a extração de informações relevantes, como a identificação de vacinas, em um contexto de grande volume de dados, onde a precisão na categorização das informações é crucial para o desenvolvimento de soluções tecnológicas inovadoras no âmbito da saúde pública. A metodologia utilizada envolveu a seleção do Manual dos Centros de Referência para Imunobiológicos Especiais (CRIE), disponível no site do Ministério da Saúde, escolhido por sua riqueza de informações. Este manual, composto por 178 páginas, foi submetido a uma análise preliminar para identificar as seções mais relevantes para o treinamento do modelo NER. O treinamento do modelo foi realizado utilizando a plataforma Google Colab, conhecida por sua flexibilidade e capacidade de execução de experimentos de aprendizado de máquina. O processo de treinamento incluiu a aplicação de técnicas de NER com um modelo pré-treinado, que foi ajustado para identificar uma nova entidade, denominada "VACINA", ao longo de 20 iterações, permitindo o aprimoramento progressivo da capacidade de reconhecimento do modelo. Os resultados obtidos após o ajuste para incluir a entidade "VACINA" mostraram uma redução significativa na perda associada ao NER, e o modelo ajustado demonstrou uma melhora substancial na precisão, sendo capaz de identificar a entidade "VACINA". A aplicação de técnicas de NER ajustadas ao contexto das vacinas mostrou-se eficaz. Contudo, é importante ressaltar que os conceitos de vacinas estão intrinsecamente ligados aos fundamentos da imunologia, sendo essencial compreender esses aspectos para uma correta interpretação (Gueshi & Cunha, 2021). Materiais didáticos frequentemente apresentam esses conceitos inter-relacionados, o que indica a necessidade de, em trabalhos futuros, investigar e treinar modelos que considerem o contexto desses conceitos e o domínio ao qual estão interconectados.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Seção
Engenharia da Computação e Sistemas