Trabalho de Formatura Supervisionado

Versão final do trabalho

Nov 20, 2010

A versão final do trabalho de formatura pode ser encontrada no painel ao lado. No item Monografia(fontes) estão os fontes em latex da monografia, da apresentação e do pôster. O link Imagens contém algumas páginas de tabloides analisados pelo programa.

Entrega preliminar

Set 20, 2010

Para esta entrega preliminar estão disponíveis o começo da monografia e a revisão 40 do programa desenvolvido junto ao trabalho. Ambos os links estão localizados no painel a esquerda e um relatório das atividades realizadas está abaixo.

Atividades realizadas

O trabalho está em dia com o cronograma e, atualmente, está em fase de estruturação do código desenvolvido nos últimos meses para a criação de uma arquitetura final que dê suporte à análise de tablóides de diferentes estabelecimentos comerciais. O código anexado ao lado já consegue detectar os produtos presentes nas páginas de um tipo de tablóides e identificar os nomes dos produtos. As partes que ainda não foram adaptadas são a detecção de preços, que usará a mesma técnica da detecção de nomes, e a passagem de um software de OCR, uma etapa que já foi testada mas ainda não está acoplada ao sistema final. Em versões de testes já foi possível realizar o processo todo, desde a aquisição da imagem até a obtenção dos nomes dos produtos em texto ASCII, porém todas as últimas etapas do processo, como passagem de OCR e detecção de preços, ainda não foram integradas ao sistema final. Abaixo estão duas imagem de resultado obtidas pelo programa. A identificação dos produtos e recorte da região com os nomes e preços foi feito de forma automática e o que está realçado em vermelho foi considerado como nome do produto.

O código disponível pode ser compilado usando a ferramenta CMake e depende da biblioteca OpenCV. No pacote zip estão não estão inclusas imagens com resolução boa para análise pois o tamanho do arquivo gerado era proibitivo, porém elas podem ser obtidas aqui. Instruções detalhadas de como compilar e usar o programa devem estar presentes na versão final do trabalho.

A entrega final terá um painel à esquerda acima da entrega preliminar com links para as versões mais atuais de todos os itens. Não existe atualmente um link para o pôster pois não comecei a fazê-lo.

Proposta da Monografia

Jun 2, 2010

Tema: Análise de imagens de encartes de promoção
Orientador: Roberto Marcondes Cesar Junior
Aluno: Igor dos Santos Montagner

Resumo da monografia

Análise de imagens de documentos é uma interessante área de estudo da Visão Computacional que visa extrair informações de imagens de documentos. Dentre os vários tipos de documentos existentes, encartes de promoções são intessantes pois são uma classe de documentos em que não existe uma estrutura bem definida nem predominância de texto. Neste trabalho vamos estudar a análise de encartes de promoções e construir um sistema capaz de extrair a combinação produto/preço de um subconjunto destes encartes.

Objetivos do trabalho

Os objetivos principais destes trabalho são construir um sistema que seja capaz de extrair as combinações produto/preço de um subconjunto de encartes de promoções e estudar como uma solução de análise de documentos baseada atenção visual pode ser usada para construir este sistema.

Atividades já realizadas

Até o momento estudamos e implementamos o modelo de atenção visual baseado em contraste de [1] e usamos seu resultado para segmentar o panfleto, obtendo somente os produtos. Uma imagem do resultado pode ser vista aqui.

Estrutura esperada da monografia

A monografia é composta por uma parte técnica e uma parte subjetiva e irá abordar os seguintes itens:

  • Introdução
  • Solução do problema proposto
  • Revisão bibliográfica
  • Avaliação de resultados obtidos
  • Referências bibliográficas
  • Dificuldades encontradas
  • Disciplinas que ajudaram na execução do trabalho

Cronograma de trabalho

  • Junho - Julho: Estudo e aplicação de diagramas de Voronoi para segmentar as imagem em termos das regiões de contraste alto
  • Julho - Agosto: Identificar preços nas células de Voronoi e associá-los com imagens de produtos. Fazer OCR dos preços e dos nomes dos produtos.
  • Setembro: Começar a escrever a monografia e estruturar código já feito para criação do sistema final.
  • Outubro: Avaliação de resultados e término da monografia.
  • Novembro: Criação do pôster

Referências

Yu-Fei Ma and Hong-Jiang Zhang, Contrast-based image attention analysis by using fuzzy growing, Proceedings of the eleventh ACM international conference on Multimedia, November 02-08, 2003, Berkeley, CA, USA