Eficiência operacional na extração de dados de balanços patrimoniais utilizando modelos de extração qualificados
##plugins.themes.bootstrap3.article.main##
Resumo
Introdução: Segundo (ZHANG et al, 2024) “hoje, Optical Character Recognition(OCR) configura-se como uma área crítica da visão computacional e do reconhecimento de padrões, visando identificar texto em dados visuais e convertê-lo em formatos digitais editáveis para posterior análise e organização.” Já o reconhecimento de entidades nomeadas (NER) foi introduzido por (Grishman &Sundheim, 1995), com o objetivo de estruturar dados não estruturados por meio da identificação automática de entidades. Com os avanços dessas tecnologias, torna-se cada vez mais viável a aplicação de sistemas inteligentes na leitura e interpretação de documentos complexos. No setor financeiro, como em muitos outros, a extração de dados de forma automatizada é uma tarefa relevante. Documentos com grande variação de layout e densidade de conteúdo, são categorizados como documentos visualmente ricos, como destacado por (Ding et al, 2024). Dentre os documentos visualmente ricos existe o balanço patrimonial, um documento importante para a área financeira, pois trata de dados sobre a saúde financeira de uma empresa, e, por envolver informações sensíveis, exige um grau de precisão considerável na captura e validação de seus dados. Considerando essa complexidade e sua importância, identifica-se um espaço para o uso de modelos de extração como forma de melhoria tecnológica no setor. Objetivo do trabalho: Embora alguns modelos de extração automática aplicados para essa finalidade apresentem bons resultados, ainda persistem desafios relacionados à confiabilidade dos dados obtidos. (SWAILEH, W. et al, 2020) implementa um sistema de extração de anuário financeiro, com OCR, NER, e aprendizado ativo. Foram implementados dois modelos, CRF e BLSTM-CRF. Cada modelo obtido possui um F1 médio score aproximado de 90.39%e 92.03% respectivamente tratando de um resultado satisfatório, mas ainda fazendo necessária a verificação de um usuário. Essa interface deve possibilitar a validação, revisão e correção dessas informações de forma clara, eficiente e acessível para especialistas. Com isso em vista este trabalho propõe um MVP, que exibe os dados extraídos e facilita sua análise por usuários qualificados, alinhado às práticas da engenharia de software. Metodologia: A metodologia adotada segue uma abordagem de pesquisa-ação, conforme proposta por SILVA et al. (2021), visando articular teoria e prática na resolução de um problema real. O estudo concentra-se na aplicação de uma solução automatizada que integra tecnologias como OCR (Optical Character Recognition), NER (Named Entity Recognition) e uma interface interativa para facilitar a extração e validação de dados em balanços patrimoniais complexos. A pesquisa é guiada pela seguinte pergunta norteadora: de que forma uma interface pode reduzir o tempo de análise de dados extraídos de balanços patrimoniais? Em uma etapa anterior desta pesquisa, foi implementada uma aplicação em um cenário real no setor de saúde e resultou uma redução de aproximadamente 40% no tempo de revisão e input de dados, segundo relato de uma empresa da área. Com base nesse resultado, a investigação atual busca avaliar a eficácia da abordagem no contexto de documentos financeiros, adotando como hipótese uma meta conservadora de redução de 30% no tempo de análise, por meio da integração entre automação inteligente e revisão humana qualificada. O MVP implementou uma interface em React, estruturada para receber dados gerados por um pipeline de extração automatizada, vindos de um modelo de OCR e NER aplicados para balanços patrimoniais, contando com funcionalidades de highlight de campos selecionados e dados do modelo exibidos na tela. Resultados obtidos: Durante o desenvolvimento deste trabalho, como antes mencionado foi construído um MVP funcional com capacidades similares aos da aplicação anterior. No cenário aplicado, foi integrado um modelo com taxa média de F1-score acima de 90% para balanço patrimonial, o que, embora ainda exija revisão humana, representa um avanço significativo frente à extração manual. Além disso, dados preliminares provenientes de testes anteriores com a aplicação anterior indicaram uma redução consideravel no tempo de revisão. Esses achados sustentam a hipótese de que, mesmo em contextos distintos, uma redução de 30% no tempo de análise de balanços patrimoniais é uma meta viável. Conclusão: Este trabalho apresentou uma solução baseada em OCR, NER e uma interface interativa para análises focadas em balanços patrimoniais. Os resultados indicam que a integração entre automação e revisão humana pode reduzir significativamente o tempo de trabalho, mantendo a confiabilidade dos dados. A hipótese de redução de 30% mostrou-se possível, abrindo espaço para investigações futuras com metas mais ambiciosas e aplicação em outros tipos de documentos.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Seção
Engenharia da Computação e Sistemas