Mudanças entre as edições de "SCC-251(Yah)"

De CoteiaWiki
(Avisos)
 
(47 revisões intermediárias por 2 usuários não estão sendo mostradas)
Linha 15: Linha 15:
 
== <font color = "red"> '''Avisos'''  </font> ==
 
== <font color = "red"> '''Avisos'''  </font> ==
  
A definir
+
Notas Finais: [http://wiki.icmc.usp.br/images/7/7b/Notas_PI.pdf]
  
 
== Critério de avaliação e datas importantes ==
 
== Critério de avaliação e datas importantes ==
Linha 24: Linha 24:
 
   Peso das provas: 50%
 
   Peso das provas: 50%
 
   Peso dos Trabalhos: 50%
 
   Peso dos Trabalhos: 50%
 +
 +
 +
=== AVISOS PROVA 1
 +
 +
Essas foram as aulas ministradas, cujo conteúdo será cobrado na P1:
 +
 +
Apresentação
 +
Fundamentos de Imagens Digitais
 +
Cor
 +
Processamento no Domínio Espacial
 +
Processamento no Domínio da Frequência (Fourier) 
 +
Segmentação (parte 1)
 +
Segmentação (parte 2)
 +
 +
Atencao, o conteudo de Restauracao e Morfologia vai ficar para a próxima prova.
 +
 +
Restauração
 +
Morfologia
  
 
== Material Didático ==
 
== Material Didático ==
Linha 29: Linha 47:
 
* Apresentação [http://www.icmc.usp.br/~viniciusrpb/SCC0251_ApresentacaoDisciplina2013.pdf]
 
* Apresentação [http://www.icmc.usp.br/~viniciusrpb/SCC0251_ApresentacaoDisciplina2013.pdf]
 
* Fundamentos de Imagens Digitais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_01_ImageFundamentals.pdf]
 
* Fundamentos de Imagens Digitais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_01_ImageFundamentals.pdf]
 +
* Cor [http://www.icmc.usp.br/~viniciusrpb/SCC0251_03_Color.pdf]
 
* Processamento no Domínio Espacial [http://www.icmc.usp.br/~viniciusrpb/SCC0251_02_GrayLevels.pdf]
 
* Processamento no Domínio Espacial [http://www.icmc.usp.br/~viniciusrpb/SCC0251_02_GrayLevels.pdf]
* Cor [http://www.icmc.usp.br/~viniciusrpb/SCC0251_03_Color.pdf]
 
 
* Processamento no Domínio da Frequência (Fourier) [http://www.icmc.usp.br/~viniciusrpb/SCC0251_04_FourierTransform.pdf]
 
* Processamento no Domínio da Frequência (Fourier) [http://www.icmc.usp.br/~viniciusrpb/SCC0251_04_FourierTransform.pdf]
 
* Restauração [http://www.icmc.usp.br/~viniciusrpb/SCC0251_05_Restoration.pdf]
 
* Restauração [http://www.icmc.usp.br/~viniciusrpb/SCC0251_05_Restoration.pdf]
Linha 38: Linha 56:
 
* Descritores de Cor [http://www.icmc.usp.br/~viniciusrpb/SCC0251_08_Description-color.pdf]
 
* Descritores de Cor [http://www.icmc.usp.br/~viniciusrpb/SCC0251_08_Description-color.pdf]
 
* Descritores de Textura [http://www.icmc.usp.br/~viniciusrpb/SCC0251_09_Description-texture.pdf]
 
* Descritores de Textura [http://www.icmc.usp.br/~viniciusrpb/SCC0251_09_Description-texture.pdf]
* Descritores de Forma [http://www.icmc.usp.br/~viniciusrpb/SCC0251_10_Description-local.pdf]
+
* Descritores de Forma [http://www.icmc.usp.br/~viniciusrpb/SCC0251_15_Description-shape.pdf]
 +
* Descritores Locais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_10_Description-local.pdf]
 +
* Seleção de Características e Redução de Dimensionalidade [http://www.icmc.usp.br/~viniciusrpb/SCC0251_16_FSS_DR.pdf]
 
* Multiresolução e Transformada Wavelet [http://www.icmc.usp.br/~viniciusrpb/SCC0251_11_Multirresolution_Wavelet.pdf]
 
* Multiresolução e Transformada Wavelet [http://www.icmc.usp.br/~viniciusrpb/SCC0251_11_Multirresolution_Wavelet.pdf]
 
* Reconhecimento de Padrões Visuais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_12_VisualPatternRecognition.pdf]
 
* Reconhecimento de Padrões Visuais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_12_VisualPatternRecognition.pdf]
 
* Detecção de Faces [http://www.icmc.usp.br/~viniciusrpb/SCC0251_14_FaceDetection.pdf]
 
* Detecção de Faces [http://www.icmc.usp.br/~viniciusrpb/SCC0251_14_FaceDetection.pdf]
  
 +
== Material Auxiliar ==
 +
 +
* Calculo da Distancia de Mahalanobis: [http://people.revoledu.com/kardi/tutorial/Similarity/MahalanobisDistance.html]
 +
 +
* Segmentação de Imagens (o que foi escrito no quadro): Método de Otsu e Descontinuidades [[Arquivo: otsu_e_derivadas.pdf]]
 +
 +
== Códigos ==
 +
 +
 +
* Aula Classificadores: K-Médias [http://wiki.icmc.usp.br/images/8/8d/Kmedias.m.zip]
 +
 +
* Códigos da aula de 07/Mar - Fundamentos de Imagens e Cores - [http://wiki.icmc.usp.br/images/f/fd/Aula1.zip]
 +
 +
* Códigos da aula de 21/Mar - Processamento no Domínio Espacial - [http://wiki.icmc.usp.br/images/e/e6/Aula2octave.zip]
 +
 +
* Códigos da aula de 04/Abril - Segmentação de Imagens - [[Arquivo: aula3.zip]]
 +
 +
* Dominio Espectral: [http://wiki.icmc.usp.br/images/6/6e/Aula5.zip]
 +
 +
* Morfologia: [http://wiki.icmc.usp.br/images/8/89/Aula6.zip]
 +
 +
conta_cel('jack2.bmp',8, [0 180 800 220])
 +
 +
o valor de retorno é a contagem de celulas.
 +
 +
variar o fator de dilatação (8 no exemplo) entre 5 e 20 (ou mais), ate bater com checagem visual.
 +
 +
especificar o roi - regiao de interesse, no caso [0 180 800 220].
  
== Código ==
+
lembrando que os dois primeiros numeros sao as coordenadas x e y da origem do roi e os dois numeros a seguir sao a largura e a altura do roi.
  
A definir
+
Exercicio em classe: Portar o exemplo da Aula6 de Matlab para Octave
 +
 
 +
Funções octave para auxiliar no porte a partir do Matlab: [http://wiki.icmc.usp.br/images/f/ff/Octave_pi.zip]
 +
 
 +
Vencedor da Gincana: Bruno Azenha [http://wiki.icmc.usp.br/images/5/56/Gincana_resultado_bruno_azenha.zip]
 +
 
 +
* Detecção de Face: [http://wiki.icmc.usp.br/images/d/da/Face.zip]
 +
 
 +
Uilize: face('onofre.jpg') ou com qualquer outro arquivo de imagem que contenha 1 ou mais faces.
 +
 
 +
Portar para OCTAVE ao final da aula
 +
 
 +
* Tranformações: [http://wiki.icmc.usp.br/images/7/79/Aula07.zip]
  
 
== Trabalhos Práticos ==
 
== Trabalhos Práticos ==
  
- Trabalho 1
+
- Trabalho 1: Data de Entrega: 23 de Maio
 +
 
 +
* AVISO:  Podem estudar a implementacao dos outros elementos estruturais no strel do octave e elaborarem a sua propria versao do linhas, ou tentarem segmentar sem usar padrao de linhas.
  
 
Realizar a contagem automática da quantidade de células da córnea na imagem a seguir, obtida por microscópio especular: [http://wiki.icmc.usp.br/images/2/24/1.bmp]
 
Realizar a contagem automática da quantidade de células da córnea na imagem a seguir, obtida por microscópio especular: [http://wiki.icmc.usp.br/images/2/24/1.bmp]
Linha 56: Linha 118:
 
O código deve estar escrito na linguagem octave e não utilizar nenhuma biblioteca fechada.
 
O código deve estar escrito na linguagem octave e não utilizar nenhuma biblioteca fechada.
  
 +
Mais imagens de teste: [http://wiki.icmc.usp.br/images/1/1f/Especular.zip]
 +
 +
Exemplo de segmentação feita pelo monitor - Vinicius: [http://wiki.icmc.usp.br/images/6/63/Resultado_especular.png]
 +
 +
Caso ideal de segmentacao (clínico): [http://wiki.icmc.usp.br/images/d/d9/Segmentacao_ideal.jpg]
 +
 +
Imagem Alternativa:
 +
 +
Contar as bolhas dessas imagems: [http://wiki.icmc.usp.br/images/d/da/Bolhas1.JPG] [http://wiki.icmc.usp.br/images/c/c6/Bolhas2.jpg]
 +
 +
Padrao Ouro
  
- Trabalho 2
+
http://wiki.icmc.usp.br/images/e/e4/Image.jpeg
 +
 
 +
 
 +
 
 +
- Trabalho 2 - Data de Entrega: 27 de Junho - Quinta Feira - Imediatamente após a prova!
  
 
Elaborar um sistema de identificação automática de fala a partir do processamento de imagens extraídas de um vídeo.
 
Elaborar um sistema de identificação automática de fala a partir do processamento de imagens extraídas de um vídeo.
Linha 78: Linha 155:
 
Cada estudante deve testar com seus próprios filmes.
 
Cada estudante deve testar com seus próprios filmes.
  
 +
 +
NOVO: Quadros de referência para teste:
 +
 +
 +
Quadros de 001 a 100: [http://wiki.icmc.usp.br/images/0/09/Guilherme_talk_1_100.zip]
 +
 +
Quadros de 101 a 200: [http://wiki.icmc.usp.br/images/a/a4/Guilherme_talk_100_200.zip]
 +
 +
Quadros de 201 a 300: [http://wiki.icmc.usp.br/images/7/7a/Guilherme_talk_201_300.zip]
 +
 +
Quadros de 301 a 400: [http://wiki.icmc.usp.br/images/c/c4/Guilherme_talk_301_400.zip]
 +
 +
Quadros de 401 a 500: [http://wiki.icmc.usp.br/images/7/75/Guilherme_talk_401_500.zip]
  
 
== Listas de Exercícios  ==
 
== Listas de Exercícios  ==
  
A definir
+
* Segmentação de Imagens - [[Arquivo: SCC0251exerciciosSegmentacao.pdf]]
 +
 
 +
* Lista 2 - Base para Prova 1: [http://wiki.icmc.usp.br/images/e/ea/Lista2.pdf]
 +
 
 +
* Lista 3 - Descritores de Forma [http://wiki.icmc.usp.br/images/5/57/ListaPCA_descForma.pdf]
 +
 
 +
* Lista 4 - Morfologia [http://wiki.icmc.usp.br/images/2/2c/Lista_Morfologia.pdf]
  
 
== Notas  ==
 
== Notas  ==

Edição atual tal como às 19h05min de 3 de julho de 2013

Universidade de São Paulo
Instituto de Ciências Matemáticas e de Computação


SCC-0251 - Processamento de Imagens


Aulas: Quinta-feira entre 13:30 e 16:00 - Sala 5-004

Professor: Mario Gazziro (Yah!) (yah [arroba] icmc . usp . br)
Horário de Atendimento: Quintas das 16h as 19h - Sala 3-245
Estagiário PAE: Vinicius Ruela Pereira Borges (viniciusrpb [arroba] icmc . usp . br)
Horário de Atendimento: agendar por e-mail.

Avisos

Notas Finais: [1]

Critério de avaliação e datas importantes

  • Primeira prova: 18/04/2013
  • Segunda prova: 27/06/2013
 Peso das provas: 50%
 Peso dos Trabalhos: 50%


=== AVISOS PROVA 1

Essas foram as aulas ministradas, cujo conteúdo será cobrado na P1:

Apresentação Fundamentos de Imagens Digitais Cor Processamento no Domínio Espacial Processamento no Domínio da Frequência (Fourier) Segmentação (parte 1) Segmentação (parte 2)

Atencao, o conteudo de Restauracao e Morfologia vai ficar para a próxima prova.

Restauração Morfologia

Material Didático

  • Apresentação [2]
  • Fundamentos de Imagens Digitais [3]
  • Cor [4]
  • Processamento no Domínio Espacial [5]
  • Processamento no Domínio da Frequência (Fourier) [6]
  • Restauração [7]
  • Morfologia [8]
  • Segmentação (parte 1) [9]
  • Segmentação (parte 2) [10]
  • Descritores de Cor [11]
  • Descritores de Textura [12]
  • Descritores de Forma [13]
  • Descritores Locais [14]
  • Seleção de Características e Redução de Dimensionalidade [15]
  • Multiresolução e Transformada Wavelet [16]
  • Reconhecimento de Padrões Visuais [17]
  • Detecção de Faces [18]

Material Auxiliar

  • Calculo da Distancia de Mahalanobis: [19]

Códigos

  • Aula Classificadores: K-Médias [20]
  • Códigos da aula de 07/Mar - Fundamentos de Imagens e Cores - [21]
  • Códigos da aula de 21/Mar - Processamento no Domínio Espacial - [22]
  • Dominio Espectral: [23]

conta_cel('jack2.bmp',8, [0 180 800 220])

o valor de retorno é a contagem de celulas.

variar o fator de dilatação (8 no exemplo) entre 5 e 20 (ou mais), ate bater com checagem visual.

especificar o roi - regiao de interesse, no caso [0 180 800 220].

lembrando que os dois primeiros numeros sao as coordenadas x e y da origem do roi e os dois numeros a seguir sao a largura e a altura do roi.

Exercicio em classe: Portar o exemplo da Aula6 de Matlab para Octave

Funções octave para auxiliar no porte a partir do Matlab: [25]

Vencedor da Gincana: Bruno Azenha [26]

  • Detecção de Face: [27]

Uilize: face('onofre.jpg') ou com qualquer outro arquivo de imagem que contenha 1 ou mais faces.

Portar para OCTAVE ao final da aula

  • Tranformações: [28]

Trabalhos Práticos

- Trabalho 1: Data de Entrega: 23 de Maio

  • AVISO: Podem estudar a implementacao dos outros elementos estruturais no strel do octave e elaborarem a sua propria versao do linhas, ou tentarem segmentar sem usar padrao de linhas.

Realizar a contagem automática da quantidade de células da córnea na imagem a seguir, obtida por microscópio especular: [29]

O código deve estar escrito na linguagem octave e não utilizar nenhuma biblioteca fechada.

Mais imagens de teste: [30]

Exemplo de segmentação feita pelo monitor - Vinicius: [31]

Caso ideal de segmentacao (clínico): [32]

Imagem Alternativa:

Contar as bolhas dessas imagems: [33] [34]

Padrao Ouro

http://wiki.icmc.usp.br/images/e/e4/Image.jpeg


- Trabalho 2 - Data de Entrega: 27 de Junho - Quinta Feira - Imediatamente após a prova!

Elaborar um sistema de identificação automática de fala a partir do processamento de imagens extraídas de um vídeo.

Para referência, utilizar método proposto por gazziro et al, publicado no paper:

"Multi-Modal Acoustic Echo Canceller for Video Conferencing Systems"

SibGrapi 2012

http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6382771

- Videos de referencia

Detecção de Face: [35]

Detecção do status da fala utilizando fluxo óptico: [36]

Nota: O aluno(a) pode usar as combinações de métodos que desejar, não sendo necessário seguir os métodos propostos pelo professor no paper. O resultado final é o que importa. Na correção serão testados videos com uma única pessoa em situações de fala e de silêncio. O programa do aluno, em octave, deve processar os frames do video e retornar um vetor com N elementos, sendo N o tempo de duração do video em segundos. Tome por base filmes com 15 Frames por Segundo no teste. Cada estudante deve testar com seus próprios filmes.


NOVO: Quadros de referência para teste:


Quadros de 001 a 100: [37]

Quadros de 101 a 200: [38]

Quadros de 201 a 300: [39]

Quadros de 301 a 400: [40]

Quadros de 401 a 500: [41]

Listas de Exercícios

  • Lista 2 - Base para Prova 1: [42]
  • Lista 3 - Descritores de Forma [43]
  • Lista 4 - Morfologia [44]

Notas

A definir

Bibliografia

Livro(s) Texto(s):

  • Gonzalez, R.C.; Woods, R.E. Processamento Digital de Imagens. São Paulo: Pearson Prentice Hall, 3.ed, 2010.
  • Gonzalez, R.C.; Woods, R.E. Digital Image Processing. Pearson Prentice Hall, 3rd. Edition, 2007.

Bibliografia Complementar:

  • Petrou, M. Image Processing: the fundamentals, 2.ed. Chichester: Wiley, 2010.
  • Bradski, G. R.; Kaehler, A.. Learning OpenCV: computer vision with the OpenCV library. Sebastopol: O’Reilly, 2008.
  • Parker, J. R. Algorithms for image processing and computer vision, 2.ed. Indianapolis: Wiley, 2010.
  • Nixon, M. S.; Aguado, A. S. Feature extraction and image processing. Amsterdam: Academic, 2008.
  • Pratt, W. K. Digital image processing, 4.ed. Hoboken: Wiley-Interscience, 2007.

Links

  • Image Processing Place [45]