Alocação de Tópicos Latentes — Um Modelo para Segmentação de Dados de Auditoria do Governo de PE.

##plugins.themes.bootstrap3.article.main##

João Alberto Amaral
http://orcid.org/0000-0002-8141-4787
Jairson Barbosa Rodrigues
http://orcid.org/0000-0003-1176-3903

Resumo




A modernização da Gestão Pública trouxe para os órgãos de Governo o desafio de adequar seus processos de auditoria e fiscalização dos recursos públicos para melhor aplicação das informações disponíveis nas bases de dados. No âmbito da Controladoria-Geral do Estado de Pernambuco, a utilização de técnicas que possibilitem a identificação de padrões e permitam descobrir ou prevenir atos de improbidade dos agentes públicos, tornou-se indispensável face ao volume de dados relevantes disponível. O fato de grande parte destes dados se apresentarem em formato textual demanda a utilização de técnicas inteligentes de mineração de texto, para atender a demanda do Controle Interno Estadual. Este artigo apresenta um estudo de caso da técnica de Alocação de Tópicos Latentes (Latent Dirichlet Allocation - LDA) aplicada sobre um conjunto de dados composto por mais de 65 mil registros de itens comprados pelo Governo Estadual entre os anos 2008 a 2017. O objetivo foi segmentar os itens adquiridos pelo Governo do Estado, aproximando-os a partir de características extraídas das suas descrições, procurando assim disponibilizar informações úteis às ações de controle. A técnica se mostrou eficaz para detectar tópicos em uma granularidade maior que a classificação humana.


Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Como Citar
Amaral, J., & Rodrigues, J. (2020). Alocação de Tópicos Latentes — Um Modelo para Segmentação de Dados de Auditoria do Governo de PE. Revista De Engenharia E Pesquisa Aplicada, 5(1), 40-49. https://doi.org/10.25286/repa.v5i1.1179
Seção
Edição Especial em Ciência de Dados e Analytics
Biografia do Autor

João Alberto Amaral, Secretaria da Controladoria do Estado de Pernambuco

Bacharel em Ciencias da Computação - CIN-UFPE (1999.2004.2) Pós-Graduaçao em Gestaão de Tecnologia da Informação - Universidade Anhanguera (2013.1 - 2014.2) Pós-Graduado em Ciências de dados e Analitycs (2017.1 - 2018.2)