Análise de Padrões em Casos Jurídicos com Mineração de Processos e Machine Learning Identificação de padrões recorrentes em processos judiciais
##plugins.themes.bootstrap3.article.main##
Resumo
A morosidade na tramitação de processos judiciais é um desafio global que impacta a eficiência e a percepção de justiça, sendo um problema acentuado no Brasil, com mais de 81 milhões de processos em andamento e um tempo médio de conclusão de 5 anos e 8 meses na Justiça Comum Estadual (CNJ, 2023). Isso impõe a necessidade de identificar e otimizar os complexos fluxos processuais, que exibem alta heterogeneidade. O objetivo do trabalho foi apresentar uma metodologia que integra a Mineração de Processos (Process Mining, técnica que visa extrair modelos de comportamento a partir de registros de atividades executadas) e a Aprendizagem de Máquina (Machine Learning, área da inteligência artificial que permite que algoritmos aprendam padrões a partir de dados) para analisar o tempo de duração de casos jurídicos. A metodologia utilizada envolveu o uso de dados públicos da Justiça Comum brasileira, especificamente de processos oriundos dos Tribunais de Justiça Estaduais, disponibilizados pelo CNJ. A fase inicial incluiu pré-processamento e criação de um log de eventos robusto, incluindo limpeza de dados, validação com o glossário oficial do CNJ, filtragem temporal, ordenação cronológica das atividades, remoção de processos sem a atividade final de arquivamento definitivo ou com apenas uma atividade, e generalização de atividades. O foco foi em processos da classe de execução fiscal. Ao final, foram obtidos 40.471 traços de processos, com aproximadamente 76% sendo sequências únicas. Para lidar com essa heterogeneidade, foi aplicada a técnica de clusterização (agrupamento de dados semelhantes por características comuns) com o algoritmo K-means, utilizando uma representação do tipo bag of activities, que transforma cada traço em um vetor de frequência das atividades, ignorando a ordem. Os melhores resultados obtidos foram alcançados com 70 clusters e o algoritmo de Elkan. Para reduzir a sensibilidade a dados extremos, traços nos percentis 5 e 95 de tempo de execução foram removidos, revelando grupos com padrões distintos. Os clusters foram subdivididos temporalmente em três categorias: processos rápidos (25% com menor tempo), médios (50% centrais) e lentos (25% mais demorados). Essa segmentação permitiu uma análise mais refinada dos perfis de casos e a identificação de padrões recorrentes. A etapa final foi a aplicação do algoritmo PrefixSpan (algoritmo de Mineração de Padrões Sequenciais que identifica sequências frequentes sem gerar candidatos explicitamente), aplicado separadamente em cada grupo. A mineração de padrões com PrefixSpan revelou sequências específicas para cada categoria de tempo: os processos rápidos (tempo médio: 2143,43 dias) apresentaram fluxos diretos, com padrões como “Distribuição, Conclusão, Expedição de documento, Arquivamento” (50,8% de suporte); os processos médios (tempo médio: 3527,68 dias) apresentaram repetição de atos de “Conclusão” e “Juntada”, com padrões como “Juntada, Conclusão, Conclusão, Arquivamento” (60,9%); e os processos lentos (tempo médio: 6363,10 dias) predominaram eventos ligados a ações de cartório, como “Recebimento Pelo Escrivão, Arquivamento” (85,9%). Em conclusão, a análise permitiu revelar comportamentos processuais característicos e sequências predominantes em diferentes perfis de duração. Os resultados fornecem subsídios para aprimorar os fluxos de trabalho no sistema judiciário, apoiar intervenções direcionadas e embasar a formulação de políticas públicas mais eficazes, representando um avanço significativo na aplicação da mineração de processos ao domínio jurídico.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Seção
Engenharia da Computação e Sistemas