Fechar

Defesa de Dissertação de Mestrado do aluno Pedro Henrique Barroso Gomes

Defesa de Dissertação de Mestrado do aluno Pedro Henrique Barroso Gomes.

Título da dissertação: FCGAN: Convoluções Espectrais via Transformada Rápida de Fourier para Campo Receptivos de Abrangência Global em Redes Adversárias Generativas

Resumo: Esta dissertação propõe a Rede Generativa Adversarial por Convolução Rápida de Fourier (FCGAN). Essa abordagem inovadora utiliza convolução no domínio da frequência para permitir que a rede opere com um campo receptivo de abrangência global. Devido aos seus campos receptivos pequenos, GANs baseadas em convoluções tradicionais enfrentam dificuldades para capturar padrões estruturais e geométricos. Nosso método utiliza Convoluções Rápidas de Fourier (FFCs), que usam Transformadas de Fourier para operar no domínio espectral, afetando globalmente os canais da imagem. Assim, a FCGAN é capaz de gerar imagens considerando informações de todas as localizações dos mapas de entrada. Essa nova característica da rede pode levar a um desempenho errático e instável. Mostramos que a utilização de normalização espectral e injeções de ruído estabilizam o treinamento adversarial. O uso de convoluções espectrais em redes convolucionais tem sido explorado para tarefas como inpainting e super-resolução de imagens. Este trabalho foca no seu potencial para geração de imagens.  Nossos experimentos também sustentam a afirmação que features de Fourier são substitutos de baixo custo operacional para camadas de self-attention, permitindo que a rede aprenda informações globais desde camadas iniciais. Apresentamos resultados qualitativos e quantitativos para demonstrar que a FCGAN proposta obtém resultados comparáveis a abordagens estado-da-arte com profundidade e número de parâmetros semelhantes, alcançando um FID de 18,98 no CIFAR-10 e 38,71 no STL-10 – uma redução de 4,98 e 1,40, respectivamente. Além disso, em maiores dimensões de imagens, o uso de FFCs em vez de self-attention permite batch-sizes com até o dobro do tamanho, e iterações até 26% mais rápidas.

 

Orientador: Prof. Dr. Marcelo Gattass

Banca: Prof. Dr. Jose Alberto Rodrigues Pereira Sardinha | Prof. Dr. Italo de Oliveira Matias | Prof. Dr. Jan Jose Hurtado Jauregui | Prof. Dr. Alberto Barbosa Raposo

 

Assista a defesa pelo link: https://puc-rio.zoom.us/j/97451706923?pwd=b2tNNEQzMmpBeU9vMkFhNzB2bnY0dz09