PRÉ-PROCESSAMENTO DE DOCUMENTOS CAPTURADOS POR CÂMERAS DE DISPOSITIVOS MÓVEIS

##plugins.themes.bootstrap3.article.main##

Luciano Roberto Leal
Byron Leite Dantas Bezerra

Resumo

Segundo uma pesquisa realizada mundialmente em 2011 pelo IDG Global Solutions, o uso de soluções em comunicação portátil como notebooks tablets e smartphones está cada vez mais inserido nas atividades humanas diárias. O objetivo principal deste trabalho é pesquisar, avaliar e propor métodos de pré-processamento de imagens para melhoria da qualidade de documentos fotografados por câmeras de smartphones, com vistas a garantir melhor legibilidade do texto presente no documento. Para isso serão estudados e implementados algoritmos de localização de documento numa imagem fotografada que seja adaptável quando se tratar de situações diversas como iluminação irregular, inclinação, distorções de perspectiva, oclusão de objetos, baixo contraste e borramento causado pela perda de foco da câmera. Como resultado preliminar  foi desenvolvido um algoritmo para a detecção da região de interesse (bordas dos documentos) presentes em frames de documentos capturados por smartphones em diversos cenários para a participação na competição Smartdoc. O algoritmo foi desenvolvido para participação na competição Smartdoc do ICDAR 2015. O algoritmo desenvolvido representou o problema prático de detectar um documento em uma imagem capturada por um smartphone, bem como aplicar um pré-processamento na imagem para posteriormente detectar as bordas aproximadas dos documentos.  Experimentos foram realizados utilizando os conjuntos de dados fornecidos pela competição. Foram utilizados seis diferentes tipos de documentos provenientes de bases de dados públicas. E com eles foram produzidos pequenos clips de vídeo de cerca de 10 segundos para cada um dos 30 documentos em cinco cenários diferentes do fundo. Os vídeos foram gravados manualmente usando uma resolução 1920x1080 HD. Os vídeos, então, sofrem com o mover da câmera, apresentando distorções como perda de foco e borrão de movimento, perspectiva, mudança de iluminação e até mesmo oclusões parciais das páginas do documento.   Para avaliar o desempenho do método foi utilizada a medida Jaccard Index que resume a capacidade de segmentar corretamente página enquanto também penaliza quando não detectam não a presença de um documento em alguns frames. O algoritmo proposto ficou em sétimo lugar competição. E é com base nos resultados dos outros algoritmos da competição que será a via de melhorar o algoritmo proposto até então. Palavras-chave: Documentos; Smartphone; Mobile; Processamento de imagens de documentos.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas

Referências

CARSTENSEN, Christina. Is your marketing ‘mobile ready’?. IDG Global Solutions, 2011.

ICDAR2015 Competition on Smartphone Document Capture and OCR (Smartdoc). J.C. Burie, J. Chazalon, M. Coustaty, S. Eskenazi, M.M. Luqman, M. Mehri, N. Nayef, J.M. Ogier, S. Prum and M. Rusiñol.