SCC-251(Yah)

De CoteiaWiki

Universidade de São Paulo
Instituto de Ciências Matemáticas e de Computação


SCC-0251 - Processamento de Imagens


Aulas: Quinta-feira entre 13:30 e 16:00 - Sala 5-004

Professor: Mario Gazziro (Yah!) (yah [arroba] icmc . usp . br)
Horário de Atendimento: Quintas das 16h as 19h - Sala 3-245
Estagiário PAE: Vinicius Ruela Pereira Borges (viniciusrpb [arroba] icmc . usp . br)
Horário de Atendimento: agendar por e-mail.

Avisos

Notas Finais: [1]

Critério de avaliação e datas importantes

  • Primeira prova: 18/04/2013
  • Segunda prova: 27/06/2013
 Peso das provas: 50%
 Peso dos Trabalhos: 50%


=== AVISOS PROVA 1

Essas foram as aulas ministradas, cujo conteúdo será cobrado na P1:

Apresentação Fundamentos de Imagens Digitais Cor Processamento no Domínio Espacial Processamento no Domínio da Frequência (Fourier) Segmentação (parte 1) Segmentação (parte 2)

Atencao, o conteudo de Restauracao e Morfologia vai ficar para a próxima prova.

Restauração Morfologia

Material Didático

  • Apresentação [2]
  • Fundamentos de Imagens Digitais [3]
  • Cor [4]
  • Processamento no Domínio Espacial [5]
  • Processamento no Domínio da Frequência (Fourier) [6]
  • Restauração [7]
  • Morfologia [8]
  • Segmentação (parte 1) [9]
  • Segmentação (parte 2) [10]
  • Descritores de Cor [11]
  • Descritores de Textura [12]
  • Descritores de Forma [13]
  • Descritores Locais [14]
  • Seleção de Características e Redução de Dimensionalidade [15]
  • Multiresolução e Transformada Wavelet [16]
  • Reconhecimento de Padrões Visuais [17]
  • Detecção de Faces [18]

Material Auxiliar

  • Calculo da Distancia de Mahalanobis: [19]

Códigos

  • Aula Classificadores: K-Médias [20]
  • Códigos da aula de 07/Mar - Fundamentos de Imagens e Cores - [21]
  • Códigos da aula de 21/Mar - Processamento no Domínio Espacial - [22]
  • Dominio Espectral: [23]

conta_cel('jack2.bmp',8, [0 180 800 220])

o valor de retorno é a contagem de celulas.

variar o fator de dilatação (8 no exemplo) entre 5 e 20 (ou mais), ate bater com checagem visual.

especificar o roi - regiao de interesse, no caso [0 180 800 220].

lembrando que os dois primeiros numeros sao as coordenadas x e y da origem do roi e os dois numeros a seguir sao a largura e a altura do roi.

Exercicio em classe: Portar o exemplo da Aula6 de Matlab para Octave

Funções octave para auxiliar no porte a partir do Matlab: [25]

Vencedor da Gincana: Bruno Azenha [26]

  • Detecção de Face: [27]

Uilize: face('onofre.jpg') ou com qualquer outro arquivo de imagem que contenha 1 ou mais faces.

Portar para OCTAVE ao final da aula

  • Tranformações: [28]

Trabalhos Práticos

- Trabalho 1: Data de Entrega: 23 de Maio

  • AVISO: Podem estudar a implementacao dos outros elementos estruturais no strel do octave e elaborarem a sua propria versao do linhas, ou tentarem segmentar sem usar padrao de linhas.

Realizar a contagem automática da quantidade de células da córnea na imagem a seguir, obtida por microscópio especular: [29]

O código deve estar escrito na linguagem octave e não utilizar nenhuma biblioteca fechada.

Mais imagens de teste: [30]

Exemplo de segmentação feita pelo monitor - Vinicius: [31]

Caso ideal de segmentacao (clínico): [32]

Imagem Alternativa:

Contar as bolhas dessas imagems: [33] [34]

Padrao Ouro

http://wiki.icmc.usp.br/images/e/e4/Image.jpeg


- Trabalho 2 - Data de Entrega: 27 de Junho - Quinta Feira - Imediatamente após a prova!

Elaborar um sistema de identificação automática de fala a partir do processamento de imagens extraídas de um vídeo.

Para referência, utilizar método proposto por gazziro et al, publicado no paper:

"Multi-Modal Acoustic Echo Canceller for Video Conferencing Systems"

SibGrapi 2012

http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6382771

- Videos de referencia

Detecção de Face: [35]

Detecção do status da fala utilizando fluxo óptico: [36]

Nota: O aluno(a) pode usar as combinações de métodos que desejar, não sendo necessário seguir os métodos propostos pelo professor no paper. O resultado final é o que importa. Na correção serão testados videos com uma única pessoa em situações de fala e de silêncio. O programa do aluno, em octave, deve processar os frames do video e retornar um vetor com N elementos, sendo N o tempo de duração do video em segundos. Tome por base filmes com 15 Frames por Segundo no teste. Cada estudante deve testar com seus próprios filmes.


NOVO: Quadros de referência para teste:


Quadros de 001 a 100: [37]

Quadros de 101 a 200: [38]

Quadros de 201 a 300: [39]

Quadros de 301 a 400: [40]

Quadros de 401 a 500: [41]

Listas de Exercícios

  • Lista 2 - Base para Prova 1: [42]
  • Lista 3 - Descritores de Forma [43]
  • Lista 4 - Morfologia [44]

Notas

A definir

Bibliografia

Livro(s) Texto(s):

  • Gonzalez, R.C.; Woods, R.E. Processamento Digital de Imagens. São Paulo: Pearson Prentice Hall, 3.ed, 2010.
  • Gonzalez, R.C.; Woods, R.E. Digital Image Processing. Pearson Prentice Hall, 3rd. Edition, 2007.

Bibliografia Complementar:

  • Petrou, M. Image Processing: the fundamentals, 2.ed. Chichester: Wiley, 2010.
  • Bradski, G. R.; Kaehler, A.. Learning OpenCV: computer vision with the OpenCV library. Sebastopol: O’Reilly, 2008.
  • Parker, J. R. Algorithms for image processing and computer vision, 2.ed. Indianapolis: Wiley, 2010.
  • Nixon, M. S.; Aguado, A. S. Feature extraction and image processing. Amsterdam: Academic, 2008.
  • Pratt, W. K. Digital image processing, 4.ed. Hoboken: Wiley-Interscience, 2007.

Links

  • Image Processing Place [45]