Remoção de ruído morfológico com aprendizado do operador da Imagem Binária
##plugins.themes.bootstrap3.article.main##
Resumo
As aplicações de Processamento Digital de Imagem estão na vanguarda da pesquisa tecnológica graças à maioria das áreas ativamente pesquisadas que permitiram a exploração de imagens em um alto nível de conhecimento como na identificação e reconhecimento de objetos, análise de movimento, rastreamento e otimização (XIE; JONES; TAM, 2017). Outras obras complementam as estradas da área de pesquisa de outra forma e provam os avanços em um baixo nível de conhecimento como o Treinamento Multi-Nível de Operadores Morfológicos Binários (HIRATA, 2009) que é a base para o desenvolvimento deste trabalho. Os Operadores Morfológicos Binários são um processamento em nível de pixel aplicado em imagens binarizadas. Uma iniciativa para colaborar com a evolução dos Operadores Morfológicos Binários é o Treinamento de Operadores de Imagem através de Exemplos (TRIOS). O TRIOS é uma pesquisa do IME-USP que explora aplicações de aprendizado de operadores de imagem em uma base que envolve construção de operadores de imagens por funções locais e operações de imagem com um modelo de estimação estatístico (MONTAGNER; HIRATA; HIRATA, 2016). Este trabalho usou o TRIOS para treinar um conjunto de dados minimalista com oito imagens de treinamento e quatro imagens de teste para a supressão de ruído das imagens de comprovantes de registro de ponto de trabalho impressos termicamente, digitalizadas por um scanner e pré-processadas com um filtro de Gaussiana Adaptativa. O objetivo deste trabalho foi treinar vários operadores estruturantes em janela (W-Operadores) para se aplicar em imagens a fim de remover o ruído que afeta os caracteres destacando as Regiões de Interesse (ROI). A etapa seguinte foi treinar W-Operadores com a combinação de duas técnicas, Regressão Logística e Árvore de Decisão, disponível no Scikit-learn (biblioteca contendo algoritmos de aprendizagem de máquina). Nesta proposta, o tamanho da janela variou de 3x3 a 49x49 para verificar a melhoria do Erro Médio Absoluto (MAE) e encontrar um ponto ideal da combinação das técnicas. Os resultados obtidos mostraram uma convergência maior e mais estável de operadores com a técnica Regressão Logística com MAE 0.004492 contra um MAE 0.007632 com uma Árvore de Decisão. Com esta informação foi proposta uma combinação das duas técnicas baseado em (MONTAGNER; HIRATA; HIRATA, 2016), seguida de aplicações simples de melhores operadores encontrados em um nível de árvore de decisão finalizada com um operador resultante de regressão logística. Durante os testes com várias imagens, observaram-se resultados semelhantes, mas há uma grande possibilidade de remoção de pontos e acentuações ou não remoção de ruído semelhante aos caracteres. A aplicação das etapas levou apenas 1,36 segundos em uma imagem de 670x660 pixels destacando o tempo de processamento da técnica.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Edição
Seção
Engenharia da Computação e Sistemas
Referências
HIRATA, N. S. T. Multilevel training of binary morphological operators. IEEE Transactions on pattern analysis and machine intelligence, v. 31, n. 4, p. 707-720, 2009.
MONTAGNER, I. S.; HIRATA, N. S. T.; HIRATA, R. Image operator learning and applications. In: Graphics, Patterns and Images Tutorials (SIBGRAPI-T), SIBGRAPI Conference on. IEEE, 2016. p. 38-50.
XIE, X.; JONES, M.; TAM, G. Recognition, Tracking, and Optimisation. International Journal of Computer Vision, v. 122, n. 3, p. 409-410, 2017.
MONTAGNER, I. S.; HIRATA, N. S. T.; HIRATA, R. Image operator learning and applications. In: Graphics, Patterns and Images Tutorials (SIBGRAPI-T), SIBGRAPI Conference on. IEEE, 2016. p. 38-50.
XIE, X.; JONES, M.; TAM, G. Recognition, Tracking, and Optimisation. International Journal of Computer Vision, v. 122, n. 3, p. 409-410, 2017.