SCC-251(Yah)
Índice
[ocultar]Universidade de São Paulo
Instituto de Ciências Matemáticas e de Computação
SCC-0251 - Processamento de Imagens
Aulas: Quinta-feira entre 13:30 e 16:00 - Sala 5-004
- Professor: Mario Gazziro (Yah!) (yah [arroba] icmc . usp . br)
- Horário de Atendimento: Quintas das 16h as 19h - Sala 3-245
- Estagiário PAE: Vinicius Ruela Pereira Borges (viniciusrpb [arroba] icmc . usp . br)
- Horário de Atendimento: agendar por e-mail.
Avisos
Notas Finais: [1]
Critério de avaliação e datas importantes
- Primeira prova: 18/04/2013
- Segunda prova: 27/06/2013
Peso das provas: 50% Peso dos Trabalhos: 50%
=== AVISOS PROVA 1
Essas foram as aulas ministradas, cujo conteúdo será cobrado na P1:
Apresentação Fundamentos de Imagens Digitais Cor Processamento no Domínio Espacial Processamento no Domínio da Frequência (Fourier) Segmentação (parte 1) Segmentação (parte 2)
Atencao, o conteudo de Restauracao e Morfologia vai ficar para a próxima prova.
Restauração Morfologia
Material Didático
- Apresentação [2]
- Fundamentos de Imagens Digitais [3]
- Cor [4]
- Processamento no Domínio Espacial [5]
- Processamento no Domínio da Frequência (Fourier) [6]
- Restauração [7]
- Morfologia [8]
- Segmentação (parte 1) [9]
- Segmentação (parte 2) [10]
- Descritores de Cor [11]
- Descritores de Textura [12]
- Descritores de Forma [13]
- Descritores Locais [14]
- Seleção de Características e Redução de Dimensionalidade [15]
- Multiresolução e Transformada Wavelet [16]
- Reconhecimento de Padrões Visuais [17]
- Detecção de Faces [18]
Material Auxiliar
- Calculo da Distancia de Mahalanobis: [19]
- Segmentação de Imagens (o que foi escrito no quadro): Método de Otsu e Descontinuidades Arquivo:Otsu e derivadas.pdf
Códigos
- Aula Classificadores: K-Médias [20]
- Códigos da aula de 07/Mar - Fundamentos de Imagens e Cores - [21]
- Códigos da aula de 21/Mar - Processamento no Domínio Espacial - [22]
- Códigos da aula de 04/Abril - Segmentação de Imagens - Arquivo:Aula3.zip
- Dominio Espectral: [23]
- Morfologia: [24]
conta_cel('jack2.bmp',8, [0 180 800 220])
o valor de retorno é a contagem de celulas.
variar o fator de dilatação (8 no exemplo) entre 5 e 20 (ou mais), ate bater com checagem visual.
especificar o roi - regiao de interesse, no caso [0 180 800 220].
lembrando que os dois primeiros numeros sao as coordenadas x e y da origem do roi e os dois numeros a seguir sao a largura e a altura do roi.
Exercicio em classe: Portar o exemplo da Aula6 de Matlab para Octave
Funções octave para auxiliar no porte a partir do Matlab: [25]
Vencedor da Gincana: Bruno Azenha [26]
- Detecção de Face: [27]
Uilize: face('onofre.jpg') ou com qualquer outro arquivo de imagem que contenha 1 ou mais faces.
Portar para OCTAVE ao final da aula
- Tranformações: [28]
Trabalhos Práticos
- Trabalho 1: Data de Entrega: 23 de Maio
- AVISO: Podem estudar a implementacao dos outros elementos estruturais no strel do octave e elaborarem a sua propria versao do linhas, ou tentarem segmentar sem usar padrao de linhas.
Realizar a contagem automática da quantidade de células da córnea na imagem a seguir, obtida por microscópio especular: [29]
O código deve estar escrito na linguagem octave e não utilizar nenhuma biblioteca fechada.
Mais imagens de teste: [30]
Exemplo de segmentação feita pelo monitor - Vinicius: [31]
Caso ideal de segmentacao (clínico): [32]
Imagem Alternativa:
Contar as bolhas dessas imagems: [33] [34]
Padrao Ouro
http://wiki.icmc.usp.br/images/e/e4/Image.jpeg
- Trabalho 2 - Data de Entrega: 27 de Junho - Quinta Feira - Imediatamente após a prova!
Elaborar um sistema de identificação automática de fala a partir do processamento de imagens extraídas de um vídeo.
Para referência, utilizar método proposto por gazziro et al, publicado no paper:
"Multi-Modal Acoustic Echo Canceller for Video Conferencing Systems"
SibGrapi 2012
http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6382771
- Videos de referencia
Detecção de Face: [35]
Detecção do status da fala utilizando fluxo óptico: [36]
Nota: O aluno(a) pode usar as combinações de métodos que desejar, não sendo necessário seguir os métodos propostos pelo professor no paper. O resultado final é o que importa. Na correção serão testados videos com uma única pessoa em situações de fala e de silêncio. O programa do aluno, em octave, deve processar os frames do video e retornar um vetor com N elementos, sendo N o tempo de duração do video em segundos. Tome por base filmes com 15 Frames por Segundo no teste. Cada estudante deve testar com seus próprios filmes.
NOVO: Quadros de referência para teste:
Quadros de 001 a 100: [37]
Quadros de 101 a 200: [38]
Quadros de 201 a 300: [39]
Quadros de 301 a 400: [40]
Quadros de 401 a 500: [41]
Listas de Exercícios
- Segmentação de Imagens - Arquivo:SCC0251exerciciosSegmentacao.pdf
- Lista 2 - Base para Prova 1: [42]
- Lista 3 - Descritores de Forma [43]
- Lista 4 - Morfologia [44]
Notas
A definir
Bibliografia
Livro(s) Texto(s):
- Gonzalez, R.C.; Woods, R.E. Processamento Digital de Imagens. São Paulo: Pearson Prentice Hall, 3.ed, 2010.
- Gonzalez, R.C.; Woods, R.E. Digital Image Processing. Pearson Prentice Hall, 3rd. Edition, 2007.
Bibliografia Complementar:
- Petrou, M. Image Processing: the fundamentals, 2.ed. Chichester: Wiley, 2010.
- Bradski, G. R.; Kaehler, A.. Learning OpenCV: computer vision with the OpenCV library. Sebastopol: O’Reilly, 2008.
- Parker, J. R. Algorithms for image processing and computer vision, 2.ed. Indianapolis: Wiley, 2010.
- Nixon, M. S.; Aguado, A. S. Feature extraction and image processing. Amsterdam: Academic, 2008.
- Pratt, W. K. Digital image processing, 4.ed. Hoboken: Wiley-Interscience, 2007.
Links
- Image Processing Place [45]