Desenvolvimento de técnicas baseadas em transformadas wavelets para o reconhecimento óptico de caracteres

##plugins.themes.bootstrap3.article.main##

Aline Geovanna Soares
Paulo Hugo Espírito Santo Lima

Resumo

O reconhecimento óptico de caracteres (OCR, Optical Character Recognition) consiste em uma série de processos que promovem a transformação da imagem digital de um caractere alfanumérico em uma representação digital de texto. Até o fim do século XX, foi produzida uma grande quantidade de documentos impressos, datilografados e até manuscritos (CENADEM, 2018). Uma vez digitalizados, o acesso às informações destes documentos é facilitada, por exemplo, por estar disponível na Internet, o que antes era limitado a quem estava fisicamente próximo aos documentos. Mesmo após a digitalização, o armazenamento e a transferência da informação podem ser inviáveis devido a grande quantidade de dados (CHEN e WEI, 2010). Com isso, os sistemas OCR foram desenvolvidos para transferir apenas as informações contidas nas imagens para outros programas ou mídias através da identificação. As transformadas walevets estão sendo largamente empregadas na análise de sinais digitais, compressão de imagens e reconhecimento de caracteres. Os coeficientes wavelets são obtidos a partir da filtragem por um banco de filtros diádicos, segmentando componentes de alta e baixa frequência em diferentes direções da imagem, o que permite a obtenção de um detalhe específico para cada faixa analisada. Na presente proposta, realizou-se a construção de um sistema OCR no ambiente Matlab, em que a transformada wavelet é usada na extração de características comuns a um grupo de imagens de caracteres numéricos manuscritos visando melhorar o desempenho das técnicas de OCR. As etapas foram: a criação de um banco de imagens testes e um dicionário a serem usados como referência para comparação a partir de dígitos populares manuscritos do Serviço Postal dos Estados Unidos (USPS); facilitar a identificação destas imagens através do pré-processamento, incluindo: binarização, dilatação, translação, normalização e erosão; e, por fim, os testes de classificação dos caracteres (cálculos de distância entre os coeficientes wavelets baseados nas operações lógicas XOR e AND, thresholding e correlação entre os gráficos gerados das projeções verticais e horizontais). Testes preliminares indicam que o sistema apresenta bom desempenho em termos da alta taxa de “verdadeiro positivo” e da baixa taxa de “falso negativo”, que correspondem ao acerto do sistema quanto ao caractere testado ou não, respectivamente. Além disso, faz parte de um processo que inclui um procedimento de decisão auxiliado por inteligência computacional, onde o uso de Redes Neurais ou Máquinas de Vetores Suporte está sendo avaliado.Palavras-chave: Reconhecimento óptico de caracteres; Transformadas wavelets; Processamento digital de imagens Referências Centro Nacional de Desenvolvimento do Gerenciamento da Informação.  PORTAL CENADEM. Disponível em: <http://www.cenadem.com.br>. Acesso em 05/08/2018. CHEN, Z.; WEI, Z. A handwriting numeral character recognition system. In: International  Conference on Multimedia  Technology. Ningbo, 2010. p.1-5.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia Elétrica (Eletrônica/Eletrotécnica/Telecomunicações)