Remoção de ruído morfológico com aprendizado do operador da Imagem Binária

##plugins.themes.bootstrap3.article.main##

Augusto Cezar Costa Pelzer
Byron Leite Dantas Bezerra
Carlos Alexandre Barros de Mello

Resumo

As aplicações de Processamento Digital de Imagem estão na vanguarda da pesquisa tecnológica graças à maioria das áreas ativamente pesquisadas que permitiram a exploração de imagens em um alto nível de conhecimento como na identificação e reconhecimento de objetos, análise de movimento, rastreamento e otimização (XIE; JONES; TAM, 2017). Outras obras complementam as estradas da área de pesquisa de outra forma e provam os avanços em um baixo nível de conhecimento como o Treinamento Multi-Nível de Operadores Morfológicos Binários (HIRATA, 2009) que é a base para o desenvolvimento deste trabalho. Os Operadores Morfológicos Binários são um processamento em nível de pixel aplicado em imagens binarizadas. Uma iniciativa para colaborar com a evolução dos Operadores Morfológicos Binários é o Treinamento de Operadores de Imagem através de Exemplos (TRIOS). O TRIOS é uma pesquisa do IME-USP que explora aplicações de aprendizado de operadores de imagem em uma base que envolve construção de operadores de imagens por funções locais e operações de imagem com um modelo de estimação estatístico (MONTAGNER; HIRATA; HIRATA, 2016). Este trabalho usou o TRIOS para treinar um conjunto de dados minimalista com oito imagens de treinamento e quatro imagens de teste para a supressão de ruído das imagens de comprovantes de registro de ponto de trabalho impressos termicamente, digitalizadas por um scanner e pré-processadas com um filtro de Gaussiana Adaptativa. O objetivo deste trabalho foi treinar vários operadores estruturantes em janela (W-Operadores) para se aplicar em imagens a fim de remover o ruído que afeta os caracteres destacando as Regiões de Interesse (ROI). A etapa seguinte foi treinar W-Operadores com a combinação de duas técnicas, Regressão Logística e Árvore de Decisão, disponível no Scikit-learn (biblioteca contendo algoritmos de aprendizagem de máquina). Nesta proposta, o tamanho da janela variou de 3x3 a 49x49 para verificar a melhoria do Erro Médio Absoluto (MAE) e encontrar um ponto ideal da combinação das técnicas. Os resultados obtidos mostraram uma convergência maior e mais estável de operadores com a técnica Regressão Logística com MAE 0.004492 contra um MAE 0.007632 com uma Árvore de Decisão. Com esta informação foi proposta uma combinação das duas técnicas baseado em (MONTAGNER; HIRATA; HIRATA, 2016), seguida de aplicações simples de melhores operadores encontrados em um nível de árvore de decisão finalizada com um operador resultante de regressão logística. Durante os testes com várias imagens, observaram-se resultados semelhantes, mas há uma grande possibilidade de remoção de pontos e acentuações ou não remoção de ruído semelhante aos caracteres. A aplicação das etapas levou apenas 1,36 segundos em uma imagem de 670x660 pixels destacando o tempo de processamento da técnica.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas
Biografia do Autor

Augusto Cezar Costa Pelzer, Universidade de Pernambuco Escola Politécnica de Pernambuco (POLI) Programa de Pós-Graduação - mestrado acadêmico - em Engenharia da Computação (PPGEC)

Programa de Pós-Graduação - mestrado acadêmico - em Engenharia da Computação (PPGEC)Escola Politécnica de Pernambuco (POLI)Universidade de Pernambuco (UPE)

Byron Leite Dantas Bezerra, Universidade de Pernambuco, POLI

Programa de Pós-Graduação - mestrado acadêmico - em Engenharia da Computação (PPGEC)Escola Politécnica de Pernambuco (POLI)Universidade de Pernambuco (UPE)

Carlos Alexandre Barros de Mello, Universidade Federal de Pernambuco, CIn

CIn-UFPECentro de Informática (CIn) da Universidade Federal de Pernambuco.

Referências

HIRATA, N. S. T. Multilevel training of binary morphological operators. IEEE Transactions on pattern analysis and machine intelligence, v. 31, n. 4, p. 707-720, 2009.

MONTAGNER, I. S.; HIRATA, N. S. T.; HIRATA, R. Image operator learning and applications. In: Graphics, Patterns and Images Tutorials (SIBGRAPI-T), SIBGRAPI Conference on. IEEE, 2016. p. 38-50.


XIE, X.; JONES, M.; TAM, G. Recognition, Tracking, and Optimisation. International Journal of Computer Vision, v. 122, n. 3, p. 409-410, 2017.