Rede Neural Completamente Convolucional para Segmentação Automática em Vídeo de Zona de Texto em Objetos

##plugins.themes.bootstrap3.article.main##

Ricardo Batista das Neves Junior
Byron Leite Dantas Bezerra

Resumo

Segmentação automática de imagens ou vídeo, é uma técnica de reconhecimento de padrões que tem por objetivo dividir pixels em diferentes grupos, em que cada grupo representa uma classe da imagem ou vídeo. A tarefa de segmentação tem sido amplamente explorada na literatura nas mais diversas aplicações, como processamento de documento (DAS NEVES JUNIOR, R. B.; VERÇOSA, L. F., et al., 2020), processamento de imagens médicas (MÜLLER, D, et al., 2021), detecção de objetos em vídeo (TEZCAN, O, et al., 2021), entre outros. Estudos recentes indicam evolução no desenvolvimento de algoritmos para processamento automático de documento, apresentando desde técnicas baseadas em algoritmos tradicionais (LEAL, L. R., 2016), até técnicas baseadas em deep learning (DAS NEVES JUNIOR, R. B.; VERÇOSA, L. F., 2020) (DAS NEVES JUNIOR; R. B., LIMA, 2020). A fim de potencializar o desenvolvimento de técnicas para processamento automático de documento, uma importante conferência promoveu uma competição (LOPES JUNIOR, C. A.; DAS NEVES JUNIOR, et al., 2021) em que equipes alcançaram resultados a cima de 0.99, 0.92 e 0.86 (de acordo com o Índice de Similaridade de Jaccard) nos desafios de segmentação de documento, zona de texto e assinatura, respectivamente. Os resultados reportados na competição indicam que o desafio de segmentação de zona de texto é um problema em aberto na literatura, podendo ser explorado em trabalhos futuros em diferentes cenários. Neste contexto, é proposto o desenvolvimento de um algoritmo de segmentação automática de vídeos, cujo objetivo final é explorar o desafio de segmentação de zona de texto presente em objetos. O pipeline do algoritmo proposto se dá em duas etapas: a primeira é a segmentação automática do objeto e a segunda é a utilização da região segmentada na etapa anterior, para executar uma segmentação automática de zona de texto. Para o desenvolvimento do algoritmo proposto, será utilizado Redes Neurais Convolucionais em conjunto com técnicas de compactação utilizadas em trabalhos anteriores (DAS NEVES JUNIOR, R. B.; LIMA, E., et al., 2020) para viabilizar a execução do algoritmo em vídeo. No desenvolvimento do modelo proposto, assume-se como hipótese que a segmentação prévia na primeira etapa do pipeline potencialize o sucesso na detecção automática de texto, presente na segunda etapa.

Downloads

Não há dados estatísticos.

##plugins.themes.bootstrap3.article.details##

Seção
Engenharia da Computação e Sistemas