Mudanças entre as edições de "SCC-251(Yah)"
(→Avisos) |
|||
(54 revisões intermediárias por 2 usuários não estão sendo mostradas) | |||
Linha 1: | Linha 1: | ||
− | + | <h2>Universidade de São Paulo<br/> | |
+ | Instituto de Ciências Matemáticas e de Computação<br/> | ||
+ | </h2><br/> | ||
+ | |||
+ | <h2>SCC-0251 - Processamento de Imagens </h2><br> | ||
Aulas: Quinta-feira entre 13:30 e 16:00 - Sala 5-004 | Aulas: Quinta-feira entre 13:30 e 16:00 - Sala 5-004 | ||
Linha 9: | Linha 13: | ||
:Horário de Atendimento: agendar por e-mail. | :Horário de Atendimento: agendar por e-mail. | ||
− | == Avisos == | + | == <font color = "red"> '''Avisos''' </font> == |
− | + | Notas Finais: [http://wiki.icmc.usp.br/images/7/7b/Notas_PI.pdf] | |
== Critério de avaliação e datas importantes == | == Critério de avaliação e datas importantes == | ||
Linha 17: | Linha 21: | ||
* Primeira prova: 18/04/2013 | * Primeira prova: 18/04/2013 | ||
* Segunda prova: 27/06/2013 | * Segunda prova: 27/06/2013 | ||
− | + | ||
+ | Peso das provas: 50% | ||
+ | Peso dos Trabalhos: 50% | ||
+ | |||
+ | |||
+ | === AVISOS PROVA 1 | ||
+ | |||
+ | Essas foram as aulas ministradas, cujo conteúdo será cobrado na P1: | ||
+ | |||
+ | Apresentação | ||
+ | Fundamentos de Imagens Digitais | ||
+ | Cor | ||
+ | Processamento no Domínio Espacial | ||
+ | Processamento no Domínio da Frequência (Fourier) | ||
+ | Segmentação (parte 1) | ||
+ | Segmentação (parte 2) | ||
+ | |||
+ | Atencao, o conteudo de Restauracao e Morfologia vai ficar para a próxima prova. | ||
+ | |||
+ | Restauração | ||
+ | Morfologia | ||
== Material Didático == | == Material Didático == | ||
Linha 23: | Linha 47: | ||
* Apresentação [http://www.icmc.usp.br/~viniciusrpb/SCC0251_ApresentacaoDisciplina2013.pdf] | * Apresentação [http://www.icmc.usp.br/~viniciusrpb/SCC0251_ApresentacaoDisciplina2013.pdf] | ||
* Fundamentos de Imagens Digitais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_01_ImageFundamentals.pdf] | * Fundamentos de Imagens Digitais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_01_ImageFundamentals.pdf] | ||
+ | * Cor [http://www.icmc.usp.br/~viniciusrpb/SCC0251_03_Color.pdf] | ||
* Processamento no Domínio Espacial [http://www.icmc.usp.br/~viniciusrpb/SCC0251_02_GrayLevels.pdf] | * Processamento no Domínio Espacial [http://www.icmc.usp.br/~viniciusrpb/SCC0251_02_GrayLevels.pdf] | ||
− | |||
* Processamento no Domínio da Frequência (Fourier) [http://www.icmc.usp.br/~viniciusrpb/SCC0251_04_FourierTransform.pdf] | * Processamento no Domínio da Frequência (Fourier) [http://www.icmc.usp.br/~viniciusrpb/SCC0251_04_FourierTransform.pdf] | ||
* Restauração [http://www.icmc.usp.br/~viniciusrpb/SCC0251_05_Restoration.pdf] | * Restauração [http://www.icmc.usp.br/~viniciusrpb/SCC0251_05_Restoration.pdf] | ||
Linha 32: | Linha 56: | ||
* Descritores de Cor [http://www.icmc.usp.br/~viniciusrpb/SCC0251_08_Description-color.pdf] | * Descritores de Cor [http://www.icmc.usp.br/~viniciusrpb/SCC0251_08_Description-color.pdf] | ||
* Descritores de Textura [http://www.icmc.usp.br/~viniciusrpb/SCC0251_09_Description-texture.pdf] | * Descritores de Textura [http://www.icmc.usp.br/~viniciusrpb/SCC0251_09_Description-texture.pdf] | ||
− | * Descritores de Forma [http://www.icmc.usp.br/~viniciusrpb/SCC0251_10_Description-local.pdf] | + | * Descritores de Forma [http://www.icmc.usp.br/~viniciusrpb/SCC0251_15_Description-shape.pdf] |
+ | * Descritores Locais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_10_Description-local.pdf] | ||
+ | * Seleção de Características e Redução de Dimensionalidade [http://www.icmc.usp.br/~viniciusrpb/SCC0251_16_FSS_DR.pdf] | ||
* Multiresolução e Transformada Wavelet [http://www.icmc.usp.br/~viniciusrpb/SCC0251_11_Multirresolution_Wavelet.pdf] | * Multiresolução e Transformada Wavelet [http://www.icmc.usp.br/~viniciusrpb/SCC0251_11_Multirresolution_Wavelet.pdf] | ||
* Reconhecimento de Padrões Visuais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_12_VisualPatternRecognition.pdf] | * Reconhecimento de Padrões Visuais [http://www.icmc.usp.br/~viniciusrpb/SCC0251_12_VisualPatternRecognition.pdf] | ||
* Detecção de Faces [http://www.icmc.usp.br/~viniciusrpb/SCC0251_14_FaceDetection.pdf] | * Detecção de Faces [http://www.icmc.usp.br/~viniciusrpb/SCC0251_14_FaceDetection.pdf] | ||
+ | == Material Auxiliar == | ||
+ | |||
+ | * Calculo da Distancia de Mahalanobis: [http://people.revoledu.com/kardi/tutorial/Similarity/MahalanobisDistance.html] | ||
+ | |||
+ | * Segmentação de Imagens (o que foi escrito no quadro): Método de Otsu e Descontinuidades [[Arquivo: otsu_e_derivadas.pdf]] | ||
+ | |||
+ | == Códigos == | ||
+ | |||
+ | |||
+ | * Aula Classificadores: K-Médias [http://wiki.icmc.usp.br/images/8/8d/Kmedias.m.zip] | ||
+ | |||
+ | * Códigos da aula de 07/Mar - Fundamentos de Imagens e Cores - [http://wiki.icmc.usp.br/images/f/fd/Aula1.zip] | ||
− | + | * Códigos da aula de 21/Mar - Processamento no Domínio Espacial - [http://wiki.icmc.usp.br/images/e/e6/Aula2octave.zip] | |
− | + | * Códigos da aula de 04/Abril - Segmentação de Imagens - [[Arquivo: aula3.zip]] | |
+ | |||
+ | * Dominio Espectral: [http://wiki.icmc.usp.br/images/6/6e/Aula5.zip] | ||
+ | |||
+ | * Morfologia: [http://wiki.icmc.usp.br/images/8/89/Aula6.zip] | ||
+ | |||
+ | conta_cel('jack2.bmp',8, [0 180 800 220]) | ||
+ | |||
+ | o valor de retorno é a contagem de celulas. | ||
+ | |||
+ | variar o fator de dilatação (8 no exemplo) entre 5 e 20 (ou mais), ate bater com checagem visual. | ||
+ | |||
+ | especificar o roi - regiao de interesse, no caso [0 180 800 220]. | ||
+ | |||
+ | lembrando que os dois primeiros numeros sao as coordenadas x e y da origem do roi e os dois numeros a seguir sao a largura e a altura do roi. | ||
+ | |||
+ | Exercicio em classe: Portar o exemplo da Aula6 de Matlab para Octave | ||
+ | |||
+ | Funções octave para auxiliar no porte a partir do Matlab: [http://wiki.icmc.usp.br/images/f/ff/Octave_pi.zip] | ||
+ | |||
+ | Vencedor da Gincana: Bruno Azenha [http://wiki.icmc.usp.br/images/5/56/Gincana_resultado_bruno_azenha.zip] | ||
+ | |||
+ | * Detecção de Face: [http://wiki.icmc.usp.br/images/d/da/Face.zip] | ||
+ | |||
+ | Uilize: face('onofre.jpg') ou com qualquer outro arquivo de imagem que contenha 1 ou mais faces. | ||
+ | |||
+ | Portar para OCTAVE ao final da aula | ||
+ | |||
+ | * Tranformações: [http://wiki.icmc.usp.br/images/7/79/Aula07.zip] | ||
== Trabalhos Práticos == | == Trabalhos Práticos == | ||
− | + | - Trabalho 1: Data de Entrega: 23 de Maio | |
+ | |||
+ | * AVISO: Podem estudar a implementacao dos outros elementos estruturais no strel do octave e elaborarem a sua propria versao do linhas, ou tentarem segmentar sem usar padrao de linhas. | ||
+ | |||
+ | Realizar a contagem automática da quantidade de células da córnea na imagem a seguir, obtida por microscópio especular: [http://wiki.icmc.usp.br/images/2/24/1.bmp] | ||
+ | |||
+ | O código deve estar escrito na linguagem octave e não utilizar nenhuma biblioteca fechada. | ||
+ | |||
+ | Mais imagens de teste: [http://wiki.icmc.usp.br/images/1/1f/Especular.zip] | ||
+ | |||
+ | Exemplo de segmentação feita pelo monitor - Vinicius: [http://wiki.icmc.usp.br/images/6/63/Resultado_especular.png] | ||
+ | |||
+ | Caso ideal de segmentacao (clínico): [http://wiki.icmc.usp.br/images/d/d9/Segmentacao_ideal.jpg] | ||
+ | |||
+ | Imagem Alternativa: | ||
+ | |||
+ | Contar as bolhas dessas imagems: [http://wiki.icmc.usp.br/images/d/da/Bolhas1.JPG] [http://wiki.icmc.usp.br/images/c/c6/Bolhas2.jpg] | ||
+ | |||
+ | Padrao Ouro | ||
+ | |||
+ | http://wiki.icmc.usp.br/images/e/e4/Image.jpeg | ||
+ | |||
+ | |||
+ | |||
+ | - Trabalho 2 - Data de Entrega: 27 de Junho - Quinta Feira - Imediatamente após a prova! | ||
+ | |||
+ | Elaborar um sistema de identificação automática de fala a partir do processamento de imagens extraídas de um vídeo. | ||
+ | |||
+ | Para referência, utilizar método proposto por gazziro et al, publicado no paper: | ||
+ | |||
+ | "Multi-Modal Acoustic Echo Canceller for Video Conferencing Systems" | ||
+ | |||
+ | SibGrapi 2012 | ||
+ | |||
+ | http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6382771 | ||
+ | |||
+ | - Videos de referencia | ||
+ | |||
+ | Detecção de Face: [http://youtu.be/lmIPR95tZjc] | ||
+ | |||
+ | Detecção do status da fala utilizando fluxo óptico: [http://youtu.be/MOjePEhIEC0] | ||
+ | |||
+ | Nota: O aluno(a) pode usar as combinações de métodos que desejar, não sendo necessário seguir os métodos propostos pelo professor no paper. O resultado final é o que importa. Na correção serão testados videos com uma única pessoa em situações de fala e de silêncio. O programa do aluno, em octave, deve processar os frames do video e retornar um vetor com N elementos, sendo N o tempo de duração do video em segundos. Tome por base filmes com 15 Frames por Segundo no teste. | ||
+ | Cada estudante deve testar com seus próprios filmes. | ||
+ | |||
+ | |||
+ | NOVO: Quadros de referência para teste: | ||
+ | |||
+ | |||
+ | Quadros de 001 a 100: [http://wiki.icmc.usp.br/images/0/09/Guilherme_talk_1_100.zip] | ||
+ | |||
+ | Quadros de 101 a 200: [http://wiki.icmc.usp.br/images/a/a4/Guilherme_talk_100_200.zip] | ||
+ | |||
+ | Quadros de 201 a 300: [http://wiki.icmc.usp.br/images/7/7a/Guilherme_talk_201_300.zip] | ||
+ | |||
+ | Quadros de 301 a 400: [http://wiki.icmc.usp.br/images/c/c4/Guilherme_talk_301_400.zip] | ||
+ | |||
+ | Quadros de 401 a 500: [http://wiki.icmc.usp.br/images/7/75/Guilherme_talk_401_500.zip] | ||
== Listas de Exercícios == | == Listas de Exercícios == | ||
+ | |||
+ | * Segmentação de Imagens - [[Arquivo: SCC0251exerciciosSegmentacao.pdf]] | ||
+ | |||
+ | * Lista 2 - Base para Prova 1: [http://wiki.icmc.usp.br/images/e/ea/Lista2.pdf] | ||
+ | |||
+ | * Lista 3 - Descritores de Forma [http://wiki.icmc.usp.br/images/5/57/ListaPCA_descForma.pdf] | ||
+ | |||
+ | * Lista 4 - Morfologia [http://wiki.icmc.usp.br/images/2/2c/Lista_Morfologia.pdf] | ||
+ | |||
+ | == Notas == | ||
A definir | A definir |
Edição atual tal como às 19h05min de 3 de julho de 2013
Índice
Universidade de São Paulo
Instituto de Ciências Matemáticas e de Computação
SCC-0251 - Processamento de Imagens
Aulas: Quinta-feira entre 13:30 e 16:00 - Sala 5-004
- Professor: Mario Gazziro (Yah!) (yah [arroba] icmc . usp . br)
- Horário de Atendimento: Quintas das 16h as 19h - Sala 3-245
- Estagiário PAE: Vinicius Ruela Pereira Borges (viniciusrpb [arroba] icmc . usp . br)
- Horário de Atendimento: agendar por e-mail.
Avisos
Notas Finais: [1]
Critério de avaliação e datas importantes
- Primeira prova: 18/04/2013
- Segunda prova: 27/06/2013
Peso das provas: 50% Peso dos Trabalhos: 50%
=== AVISOS PROVA 1
Essas foram as aulas ministradas, cujo conteúdo será cobrado na P1:
Apresentação Fundamentos de Imagens Digitais Cor Processamento no Domínio Espacial Processamento no Domínio da Frequência (Fourier) Segmentação (parte 1) Segmentação (parte 2)
Atencao, o conteudo de Restauracao e Morfologia vai ficar para a próxima prova.
Restauração Morfologia
Material Didático
- Apresentação [2]
- Fundamentos de Imagens Digitais [3]
- Cor [4]
- Processamento no Domínio Espacial [5]
- Processamento no Domínio da Frequência (Fourier) [6]
- Restauração [7]
- Morfologia [8]
- Segmentação (parte 1) [9]
- Segmentação (parte 2) [10]
- Descritores de Cor [11]
- Descritores de Textura [12]
- Descritores de Forma [13]
- Descritores Locais [14]
- Seleção de Características e Redução de Dimensionalidade [15]
- Multiresolução e Transformada Wavelet [16]
- Reconhecimento de Padrões Visuais [17]
- Detecção de Faces [18]
Material Auxiliar
- Calculo da Distancia de Mahalanobis: [19]
- Segmentação de Imagens (o que foi escrito no quadro): Método de Otsu e Descontinuidades Arquivo:Otsu e derivadas.pdf
Códigos
- Aula Classificadores: K-Médias [20]
- Códigos da aula de 07/Mar - Fundamentos de Imagens e Cores - [21]
- Códigos da aula de 21/Mar - Processamento no Domínio Espacial - [22]
- Códigos da aula de 04/Abril - Segmentação de Imagens - Arquivo:Aula3.zip
- Dominio Espectral: [23]
- Morfologia: [24]
conta_cel('jack2.bmp',8, [0 180 800 220])
o valor de retorno é a contagem de celulas.
variar o fator de dilatação (8 no exemplo) entre 5 e 20 (ou mais), ate bater com checagem visual.
especificar o roi - regiao de interesse, no caso [0 180 800 220].
lembrando que os dois primeiros numeros sao as coordenadas x e y da origem do roi e os dois numeros a seguir sao a largura e a altura do roi.
Exercicio em classe: Portar o exemplo da Aula6 de Matlab para Octave
Funções octave para auxiliar no porte a partir do Matlab: [25]
Vencedor da Gincana: Bruno Azenha [26]
- Detecção de Face: [27]
Uilize: face('onofre.jpg') ou com qualquer outro arquivo de imagem que contenha 1 ou mais faces.
Portar para OCTAVE ao final da aula
- Tranformações: [28]
Trabalhos Práticos
- Trabalho 1: Data de Entrega: 23 de Maio
- AVISO: Podem estudar a implementacao dos outros elementos estruturais no strel do octave e elaborarem a sua propria versao do linhas, ou tentarem segmentar sem usar padrao de linhas.
Realizar a contagem automática da quantidade de células da córnea na imagem a seguir, obtida por microscópio especular: [29]
O código deve estar escrito na linguagem octave e não utilizar nenhuma biblioteca fechada.
Mais imagens de teste: [30]
Exemplo de segmentação feita pelo monitor - Vinicius: [31]
Caso ideal de segmentacao (clínico): [32]
Imagem Alternativa:
Contar as bolhas dessas imagems: [33] [34]
Padrao Ouro
http://wiki.icmc.usp.br/images/e/e4/Image.jpeg
- Trabalho 2 - Data de Entrega: 27 de Junho - Quinta Feira - Imediatamente após a prova!
Elaborar um sistema de identificação automática de fala a partir do processamento de imagens extraídas de um vídeo.
Para referência, utilizar método proposto por gazziro et al, publicado no paper:
"Multi-Modal Acoustic Echo Canceller for Video Conferencing Systems"
SibGrapi 2012
http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6382771
- Videos de referencia
Detecção de Face: [35]
Detecção do status da fala utilizando fluxo óptico: [36]
Nota: O aluno(a) pode usar as combinações de métodos que desejar, não sendo necessário seguir os métodos propostos pelo professor no paper. O resultado final é o que importa. Na correção serão testados videos com uma única pessoa em situações de fala e de silêncio. O programa do aluno, em octave, deve processar os frames do video e retornar um vetor com N elementos, sendo N o tempo de duração do video em segundos. Tome por base filmes com 15 Frames por Segundo no teste. Cada estudante deve testar com seus próprios filmes.
NOVO: Quadros de referência para teste:
Quadros de 001 a 100: [37]
Quadros de 101 a 200: [38]
Quadros de 201 a 300: [39]
Quadros de 301 a 400: [40]
Quadros de 401 a 500: [41]
Listas de Exercícios
- Segmentação de Imagens - Arquivo:SCC0251exerciciosSegmentacao.pdf
- Lista 2 - Base para Prova 1: [42]
- Lista 3 - Descritores de Forma [43]
- Lista 4 - Morfologia [44]
Notas
A definir
Bibliografia
Livro(s) Texto(s):
- Gonzalez, R.C.; Woods, R.E. Processamento Digital de Imagens. São Paulo: Pearson Prentice Hall, 3.ed, 2010.
- Gonzalez, R.C.; Woods, R.E. Digital Image Processing. Pearson Prentice Hall, 3rd. Edition, 2007.
Bibliografia Complementar:
- Petrou, M. Image Processing: the fundamentals, 2.ed. Chichester: Wiley, 2010.
- Bradski, G. R.; Kaehler, A.. Learning OpenCV: computer vision with the OpenCV library. Sebastopol: O’Reilly, 2008.
- Parker, J. R. Algorithms for image processing and computer vision, 2.ed. Indianapolis: Wiley, 2010.
- Nixon, M. S.; Aguado, A. S. Feature extraction and image processing. Amsterdam: Academic, 2008.
- Pratt, W. K. Digital image processing, 4.ed. Hoboken: Wiley-Interscience, 2007.
Links
- Image Processing Place [45]