Estudo de algoritmos de pré-processamento e segmentação de imagens em documentos de identificação

##plugins.themes.bootstrap3.article.main##

Álysson de Sá Soares
Byron Leite Dantas Bezerra
Ricardo Batista das Neves Junior

Resumo

Atualmente há uma grande demanda na área de processamento de imagens de documentosde identificação pessoal, geralmente enviados por dispositivos móveis, a pedido de empresasou instituições governamentais (GAI, 2018), a fim de que sejam processados por estasinstituições. Neste contexto, os documentos podem passar por processos de extração decampos de texto (DAS NEVES JUNIOR, 2020), extração de assinaturas (LOPES JUNIOR ,2020 ), entre outros. Entretanto, devido a nova Lei Geral de Proteção de Dados Pessoais(LGPD), é vedada a divulgação de informações pessoais, tais como as presentes nosdocumentos de Registro Geral (RG), Carteira Nacional de Habilitação (CNH), Cadastro dePessoa Física (CPF), etc. Com essa limitação em foco, o presente trabalho teve como objetivodesenvolver um algoritmo capaz de eliminar destes documentos as informações sensíveis esubstituí-las por outros dados de forma a não violar a LGPD. Desta forma, temos comoresultado deste trabalho a criação da primeira base de dados de documentos pessoais comacesso possível aos pesquisadores interessados, uma vez que os dados nela presentes sãofalsos. Como metodologia, o projeto explicita todo o algoritmo desenvolvido dividido em duaspartes. A primeira consistiu na rotulação das regiões de textos presentes nos documentos e opré-processamento destas imagens para remoção dessa informação. A segunda etapa, foi oprocesso de manipulação das imagens com dados sintéticos para gerar a base de dadosintitulada Brazilian Identity Document Dataset (BID Dataset), contendo três tipos dedocumentos: CNH, CPF e RG. Como resultado, 28800 imagens com diferentes textos, ruídos evariações de iluminação, integram BID Dataset, juntamente com seus respectivos Ground Truth(GT) divididos em dois subconjuntos. Assim, a base criada serve tanto para os desafios deOptical Character Recognition (OCR), quanto para desafios de segmentação de texto. Sendoassim, o presente trabalho tem potencial para se tornar uma referência na área deprocessamento de imagens, visto que o BID Dataset é a primeira base de dados pública dedocumentos pessoais, possibilitando novos estudos na área de reconhecimento de escrita esegmentação de textos em documentos.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas