Mudanças entre as edições de "SCC-251(Yah)"

De CoteiaWiki
Linha 48: Linha 48:
 
== Trabalhos Práticos ==
 
== Trabalhos Práticos ==
  
A definir
+
- Trabalho 1
 +
 
 +
Realizar a contagem automática da quantidade de células da córnea na imagem a seguir, obtida por microscópio especular: [http://wiki.icmc.usp.br/images/2/24/1.bmp]
 +
 
 +
O código deve estar escrito na linguagem octave e não utilizar nenhuma biblioteca fechada.
 +
 
 +
 
 +
- Trabalho 2
 +
 
 +
Elaborar um sistema de identificação automática de fala a partir do processamento de imagens extraídas de um vídeo.
 +
 
 +
Para referência, utilizar método proposto por gazziro et al, publicado no paper:
 +
 
 +
"Multi-Modal Acoustic Echo Canceller for Video Conferencing Systems"
 +
 
 +
SibGrapi 2012
 +
 
 +
http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6382771
 +
 
 +
- Videos de referencia
 +
 
 +
Detecção de Face: [http://youtu.be/lmIPR95tZjc]
 +
 
 +
Detecção do status da fala utilizando fluxo óptico: [http://youtu.be/MOjePEhIEC0]
 +
 
 +
Nota: O aluno(a) pode usar as combinações de métodos que desejar, não sendo necessário seguir os métodos propostos pelo professor no paper. O resultado final é o que importa. Na correção serão testados videos com uma única pessoa em situações de fala e de silêncio. O programa do aluno, em octave, deve processar os frames do video e retornar um vetor com N elementos, sendo N o tempo de duração do video em segundos. Tome por base filmes com 15 Frames por Segundo no teste.
 +
Cada estudante deve testar com seus próprios filmes.
 +
 
  
 
== Listas de Exercícios  ==
 
== Listas de Exercícios  ==

Edição das 01h27min de 9 de março de 2013

Universidade de São Paulo
Instituto de Ciências Matemáticas e de Computação


SCC-0251 - Processamento de Imagens


Aulas: Quinta-feira entre 13:30 e 16:00 - Sala 5-004

Professor: Mario Gazziro (Yah!) (yah [arroba] icmc . usp . br)
Horário de Atendimento: Quintas das 16h as 19h - Sala 3-245
Estagiário PAE: Vinicius Ruela Pereira Borges (viniciusrpb [arroba] icmc . usp . br)
Horário de Atendimento: agendar por e-mail.

Avisos

A definir

Critério de avaliação e datas importantes

  • Primeira prova: 18/04/2013
  • Segunda prova: 27/06/2013
  • Trabalhos: a definir

Material Didático

  • Apresentação [1]
  • Fundamentos de Imagens Digitais [2]
  • Processamento no Domínio Espacial [3]
  • Cor [4]
  • Processamento no Domínio da Frequência (Fourier) [5]
  • Restauração [6]
  • Morfologia [7]
  • Segmentação (parte 1) [8]
  • Segmentação (parte 2) [9]
  • Descritores de Cor [10]
  • Descritores de Textura [11]
  • Descritores de Forma [12]
  • Multiresolução e Transformada Wavelet [13]
  • Reconhecimento de Padrões Visuais [14]
  • Detecção de Faces [15]


Código

A definir

Trabalhos Práticos

- Trabalho 1

Realizar a contagem automática da quantidade de células da córnea na imagem a seguir, obtida por microscópio especular: [16]

O código deve estar escrito na linguagem octave e não utilizar nenhuma biblioteca fechada.


- Trabalho 2

Elaborar um sistema de identificação automática de fala a partir do processamento de imagens extraídas de um vídeo.

Para referência, utilizar método proposto por gazziro et al, publicado no paper:

"Multi-Modal Acoustic Echo Canceller for Video Conferencing Systems"

SibGrapi 2012

http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6382771

- Videos de referencia

Detecção de Face: [17]

Detecção do status da fala utilizando fluxo óptico: [18]

Nota: O aluno(a) pode usar as combinações de métodos que desejar, não sendo necessário seguir os métodos propostos pelo professor no paper. O resultado final é o que importa. Na correção serão testados videos com uma única pessoa em situações de fala e de silêncio. O programa do aluno, em octave, deve processar os frames do video e retornar um vetor com N elementos, sendo N o tempo de duração do video em segundos. Tome por base filmes com 15 Frames por Segundo no teste. Cada estudante deve testar com seus próprios filmes.


Listas de Exercícios

A definir

Notas

A definir

Bibliografia

Livro(s) Texto(s):

  • Gonzalez, R.C.; Woods, R.E. Processamento Digital de Imagens. São Paulo: Pearson Prentice Hall, 3.ed, 2010.
  • Gonzalez, R.C.; Woods, R.E. Digital Image Processing. Pearson Prentice Hall, 3rd. Edition, 2007.

Bibliografia Complementar:

  • Petrou, M. Image Processing: the fundamentals, 2.ed. Chichester: Wiley, 2010.
  • Bradski, G. R.; Kaehler, A.. Learning OpenCV: computer vision with the OpenCV library. Sebastopol: O’Reilly, 2008.
  • Parker, J. R. Algorithms for image processing and computer vision, 2.ed. Indianapolis: Wiley, 2010.
  • Nixon, M. S.; Aguado, A. S. Feature extraction and image processing. Amsterdam: Academic, 2008.
  • Pratt, W. K. Digital image processing, 4.ed. Hoboken: Wiley-Interscience, 2007.

Links

  • Image Processing Place [19]