Defesa de Tese de Doutorado do aluno  Lucas Caracas de Figueiredo

Defesa de Tese de Doutorado do aluno  Lucas Caracas de Figueiredo

Título da tese: Deep-Learning-Based Shape Matching Framework on 3D CAD Models

Resumo:

Modelos CAD 3D ricos em dados são essenciais durante os diferentes estágios do ciclo de vida de projetos de engenharia. Devido à recente popularização da metodologia BIM e do uso de Gêmeos Digitais para a manufatura inteligente, a quantidade de detalhes, o tamanho, e a complexidade desses modelos aumentaram significativamente. Apesar desses modelos serem compostos de várias geometrias repetidas, os softwares de projeto de plantas geralmente não proveem nenhuma informação de instanciação. Trabalhos anteriores demonstraram que removendo a redundância na representação dos modelos CAD 3D reduz significativamente o armazenamento e requisição de memória deles, ao passo que facilita otimizações de renderização. Este trabalho propõe um arcabouço para correspondência de formas baseado em aprendizado profundo que minimiza as informações redundantes de um modelo CAD 3D a esse respeito. Nos apoiamos nos avanços recentes no processamento profundo de nuvens de pontos, superando desvantagens de trabalhos anteriores, como a forte dependência da ordenação dos vértices e topologia das malhas de triângulos. O arcabouço desenvolvido utiliza nuvens de pontos uniformemente amostradas para identificar similaridades entre malhas em modelos CAD 3D e computam uma matriz de transformação afim ótima para instancia-las. Resultados em modelos CAD 3D reais demonstram o valor do arcabouço proposto. O procedimento de registro de nuvem de pontos desenvolvido atinge um erro de superfície menor, ao mesmo tempo que executa mais rápido que abordagens anteriores. A abordagem supervisionada de classificação desenvolvida atingiu resultados equivalentes em comparação com métodos limitados anteriores e os superou significativamente num cenário de embaralhamento de vértices. Propomos também uma abordagem não supervisionada que agrupa malhas semelhantes e supera a necessidade de rotular explicitamente as geometrias no modelo CAD 3D. Este método não supervisionado obtém resultados competitivos quando comparados às abordagens anteriores, até mesmo superando-os em determinados cenários.

Orientador: Prof. Dr. Waldemar Celes Filho

Banca:

Prof. Dr. Paulo Ivson Netto Santos

Prof. Dr. Manuel Menezes de Oliveira Neto

Prof. Dr. Anselmo Cardoso de Paiva

Prof. Dr. Marley Maria Bernardes Rebuzzi Vellasco

Prof. Dr.  Marcelo Gattass

Prof. Dr. Luiz Henrique de Figueiredo

Prof. Dr. Alberto Barbosa Raposo

Acompanhe-nos também pelo link: https://puc-rio.zoom.us/j/98970035820?pwd=Vno5Ym44c3hETWZKYVVVOWF0TUlpZz09

 

Defesa de Tese de Doutorado do aluno Jonatas do Santos Grosman

Defesa de Tese de Doutorado do aluno Jonatas do Santos Grosman

Título da tese: Assessing the Robustness of Large Pre-trained Models in the Speech Recognition

Resumo: 

Utilizar representações fornecidas por um grande modelo pré-treinado tornou-se a principal estratégia para alcançar o estado da arte nas mais variadas tarefas. Um grande modelo pré-treinado recentemente proposto, wav2vec 2.0, foi seminal para vários outros trabalhos sobre pré-treinamento de grandes modelos em dados de fala. Muitos modelos estão sendo pré-treinados usando a mesma arquitetura baseada em transformer que o wav2vec 2.0 e estão obtendo o estado da arte em várias tarefas relacionadas à fala. No entanto, poucos trabalhos propuseram maiores investigações sobre a robustez desses modelos. Nosso trabalho visa investigar a robustez desses modelos em dois aspectos diferentes. O primeiro é sobre a transferibilidade entre línguas desses modelos. Nossos experimentos nos mostraram que o tamanho dos dados usados durante o pré-treinamento desses modelos não é tão crucial para a transferibilidade quanto a diversidade. Percebemos que o desempenho das línguas indo-europeias é superior ao das línguas não indo-europeias nos modelos avaliados. Vimos uma transferência positiva de conhecimento entre línguas usando modelos monolinguais, o que foi percebido em todos os idiomas que usamos, mas foi mais evidente quando o idioma usado durante o pré-treinamento era mais semelhante ao idioma do fine-tuning. O segundo aspecto de robustez que investigamos em nosso trabalho é quão bem esses modelos se comportam em cenários de desbalanceamento de dados, onde há um subconjunto mais representativo no conjunto de dados do fine-tuning. Nossos resultados mostraram que o desbalanceamento dos dados no fine-tuning geralmente afeta o resultado final dos modelos, com melhor desempenho nos subconjuntos mais representativos. No entanto, uma maior variabilidade no conjunto de treinamento favorece o desempenho do modelo para um subconjunto mais representativo. Porém essa maior variabilidade nos dados não favoreceu os idiomas não vistos durante o treinamento. Observamos também que em alguns cenários os modelos parecem mais robustos em lidar com o desbalanceamento de gênero do que idade ou sotaque. Com esses achados, esperamos ajudar a comunidade científica na utilização de modelos pré-treinados existentes, bem como auxiliar no pré-treinamento de novos modelos.

 

Orientador: Prof. Dr. Hélio Côrtes Vieira Lopes

Banca: 

Prof. Dr. Cassio Freitas Pereira de Almeida

Prof. Dr. Guilherme Gonçalves Schardong

Prof. Dr. Bruno Feijo

Prof. Dr. Marcus Vinicius Soledade Poggi de Aragao

Prof. Dr. Luiz Carlos Pacheco Rodrigues Velho

Acompanhe-nos também no site: http://www.inf.puc-rio.br/blog/noticia/noticia/defesa-de-tese-de-doutorado-assessing-the-robustness-of-large-pre-trained-models-in-the-speech-recognition

 

 

Defesa de Tese de Doutorado do aluno Italo G. Santana

Defesa de Tese de Doutorado do aluno Italo G. Santana

Título da dissertação: Exploring the frontier of Combinatorial Optimization and Machine Learning: Applications to Vehicle routing and Support Vector Machines

Resumo: A otimização combinatória (OC) está presente em inúmeras aplicações práticas (por exemplo, planejamento de produção, programação, logística, etc.). Ao longo dos anos, OC e aprendizado de máquina (AM) surgiram, juntas, como uma área prospectiva de pesquisa para melhorar processos de tomada de decisão. Nesse contexto, há interesse em utilizar algoritmos de AM para melhorar métodos de OC. Por outro lado, como muitas tarefas de AM podem ser reformuladas como problemas de otimização, há um amplo interesse em utilizar métodos de OC para resolver esses problemas. Nesta tese, três estudos que conectam OC e AM em torno de duas aplicações importantes são conduzidos: o problema de roteamento de veículos capacitado (PRVC) e máquinas de vetores de suporte com perda em margem rígida (SVM-HML  — do inglês support vector machines with hard-margin loss). No primeiro estudo, uma estratégia para explorar vizinhanças de busca local de alta ordem por mineração de padrões em duas meta-heurísticas estado da arte para o PRVC é proposta. Em um segundo estudo, também no contexto do PRVC, critérios de relacionamento para nós de clientes baseados em saídas de redes neurais em grafos são explorados. Com base nessas saídas, medidas de relação podem ser exploradas para orientar a busca local e estender operadores de cruzamento em um algoritmo genético estado da arte. Por fim, no terceiro estudo, uma abordagem eficiente de programação inteira mista baseada em cortes combinatórios de Benders e estratégias de amostragem são utilizadas para treinar modelos de SVM-HML de maneira mais eficiente.

Orientador: Prof. Dr. Thibaut Victor Gaston Vidal

Banca: 

Prof. Dr.  Andrea Lodi

Prof. Dr. Artur Alves Pessoa

Prof. Dr. Rafael Martinelli Pinto

Prof. Dr. Marco Serpa Molinaro

Prof. Dr. Eduardo Uchoa Barboza

Prof. Dr. Helio Côrtes Vieira Lopes

Acompanhe-nos também no site: https://puc-rio.zoom.us/j/3457513766?pwd=WExyZFd3dWQ0WkZNUENWSmc3WTYvQT09

 

 

Defesa de Tese de Doutorado do aluno Angelo Batista Neves Junior

Defesa de Tese de Doutorado do aluno Angelo Batista Neves Junior

Título da dissertação: Automatic Generation of Benchmarks for Evaluating Keyword and Natural Language Interfaces to RDF Datasets

Resumo: Os sistemas de busca textual fornecem aos usuários uma alternativa amigável para acessar datasets RDF (Resource Description Framework). A avaliação de desempenho de tais sistemas requer benchmarks adequados, consistindo de datasets RDF, consultas e respectivas respostas esperadas. No entanto, os benchmarks disponíveis geralmente possuem poucas consultas e respostas incompletas, principalmente porque são construídos manualmente com a ajuda de especialistas. A contribuição central desta tese é um método para construir benchmarks automaticamente, com um maior número de consultas e com respostas mais completas. O método proposto aplica-se tanto a consultas baseadas em palavras-chave quanto em linguagem natural e possui duas partes: geração de consultas e geração de respostas. A geração de consultas seleciona um conjunto de entidades relevantes, chamadas de indutores, e, para cada uma, heurísticas orientam o processo de extração de consultas relacionadas. A geração de respostas recebe as consultas produzidas no passo anterior e computa geradores de solução (SG), subgrafos do dataset original contendo diferentes respostas às consultas. Heurísticas também orientam a construção dos SGs evitando o desperdício de recursos computacionais na geração de respostas irrelevantes.

Orientador: Prof. Dr. Marco Antonio Casanova

Banca: 

Prof. Dr. Luiz André Portes Paes Leme

Prof. Dr. Geraldo Bonorino Xexéo

Prof(a) Dr(a) Vânia Maria Ponte Vidal

Prof. Dr. Antonio Luz Furtado

Prof(a) Dr(a) Melissa Lemos Cavaliére

Prof. Dr. José Antonio Fernandes de Macêdo

Prof(a) Dr(a) Simone Diniz Junqueira Barbosa

Acompanhe-nos também pelo link: https://puc-rio.zoom.us/j/93760975741?pwd=YXVNcUQzTTlNa2ZlOVhyd1BhLzkwdz09

 

 

Mestrado e Doutorado em Informática – Resultado

Finalizamos o nosso processo seletivo para o Mestrado e Doutorado no Programa de Pós-Graduação do Departamento de Informática (DI) da PUC-Rio.

Nosso programa foi o primeiro programa de pós-graduação em Computação do país e o primeiro a obter o conceito máximo (7) junto à CAPES, mantendo este conceito até hoje. O conceito CAPES 7 é atribuído a programas que possuem produção científica compatível com a de centros de excelência internacionais. Naturalmente nosso processo é concorrido e contamos com a compreensão dos que não puderam ser admitidos nesta oportunidade.

Os selecionados para o mestrado foram: 

 

Alex de Lima Bassi 

Alexsandra da Silva Lázaro 

Anne Vitoria Rodrigues de Souza 

Bianca Moreira Cunha

Daniel Villela de Almeida

Dieinison Jack Freire Braga

Fábio Vasconcelos Cantão de Lima

Fernando Bernardo dos Santos

João Victor Farrulla Darze

Johny Arriel

Jorge Alfonso Rodríguez Méndez

Jose Rodrigo Vilca Vargas

Juliana Heluy do Prado

Leonardo Góes Ferreira

Lucas Zillig Barros Oliveira

Luis Amaral

Marco Antônio Barbosa Teixeira

Mateus Levi Simões Fernandes

Rodrigo Brito de Freitas Lima

Samir Patrice Batista da Silva 

Sandro Athaide Coelho 

Wesley da Silva Santos 

 

Os selecionados para o doutorado foram: 

 

Anderson Silva Fonseca

Anna Di Lorenzo

Antonio Carlos Pereira de Azambuja

Antony Seabra de Medeiros 

Gabriel Diniz Junqueira Barbosa

Julio Omar Prieto Entenza 

Lucas Cordeiro Romão

Luís Fernando Teixeira Bicalho

Matheus Manhães Masson

Millena de Andrade Almeida Gomes Cavalcante

Nelia Cantanhede Reis 

Reforçamos que na PUC-Rio, por seu destacado papel de liderança na América Latina em integração com a indústria, sempre temos oportunidades de bolsas de complemento (acumuláveis com bolsas de fomento) ou de remuneração de carteira assinada referentes à participação em projetos de pesquisa e desenvolvimento coordenados pelos professores do nosso quadro principal. Todos os alunos que, através do nosso programa, servem à ciência Brasileira em dedicação integral possuem bolsa de fomento (recebem para apoiar as pesquisas do programa) ou ao menos bolsa de isenção integral (não pagam). Além disso, nosso programa de mestrado tem apoiado a capacitação de profissionais com dedicação em tempo parcial através de convênios com empresas e possibilidades de formação com recursos próprios.

Parabenizamos a todos os selecionados, esperamos que seja uma jornada de muito estudo, pesquisa e crescimento pessoal e profissional!

Se você perdeu esse processo seletivo, fique antenado nas nossas redes sociais, o próximo terá início em Novembro!

 

Inscrições Prorrogadas – Mestrado e Doutorado em Informática

As inscrições para o programa de pós-graduação em Informática (Mestrado e Doutorado) oferecido pelo Departamento de Informática da PUC-Rio foram prorrogadas até o dia 15 de julho de 2022. O edital abrange as seguintes áreas de concentração:

  •         Bancos de Dados (BD)
  •         Ciência de Dados (CD)
  •         Computação Gráfica (CG)
  •         Engenharia de Software (ES)
  •         Hipertexto e Multimídia (HM)
  •         Interação Humano-Computador (IHC)
  •         Linguagens de Programação (LP)
  •         Otimização e Raciocínio Automático (OTR)
  •         Redes de Computadores e Sistemas Distribuídos (RCSD)
  •         Teoria da Computação (TC)

Cada área de concentração tem diversas linhas de pesquisa, dentre as quais se pode citar: Jogos e Entretenimento Digital; Visualização 3D; Engenharia de Software Experimental; Computação Móvel; e Redes de Alta Velocidade. Outras linhas têm caráter mais interdisciplinar, como Bioinformática e Inteligência Artificial (pesquisadas em várias das áreas de concentração do DI).

O Programa de Pós-Graduação do Departamento de Informática da PUC-Rio (DI) tem sua excelência reconhecida por pesquisadores e instituições nacionais e internacionais, bem como por órgãos dos ministérios de Ciência e Tecnologia e da Educação que avaliam os pesquisadores e os programas de pós-graduação do Brasil. Na avaliação da CAPES o programa é avaliado com conceito máximo (7).  

Defesa de Dissertação de Mestrado do aluno Pedro Vinicius Almeida de Freitas

Defesa de Dissertação de Mestrado do aluno Pedro Vinicius Almeida de Freitas

Título da dissertação:

Sensitive Content Detection in Video with Deep Learning

Resumo:

Grandes quantidades de vídeo são carregadas em plataformas de hospedagem de vídeo a cada minuto. Esse volume de dados apresenta um desafio no controle do tipo de conteúdo enviado para esses serviços de hospedagem de vídeo, pois essas plataformas são responsáveis por qualquer mídia sensível enviada por seus usuários. Nesta dissertação, definimos conteúdo sensível como sexo, violência, gore ou qualquer mídia que possa causar angústia no espectador. Apresentamos um conjunto de dados de vídeo sensível para classificação binária de vídeo (se há conteúdo sensível no vídeo ou não), contendo 127 mil vídeos anotados, cada um com seus embeddings de áudio e visual extraídos. Também treinamos e avaliamos quatro modelos baseline para a tarefa de detecção de conteúdo sensível em vídeo. O modelo com melhor desempenho obteve 99% de F2-Score ponderado no nosso subconjunto de testes e 88,83% no conjunto de dados NPDI pornography-2k.

Orientador:

Prof. Doutor Sérgio Colcher

Banca:

Prof(a) Doutor(a) Sandra Eliza Fontes

Prof Doutor Alberto Barbosa Raposo

Prof. Doutor Julio Cesar Duarte

Acompanhe-nos pelo link:

http://www.inf.puc-rio.br/blog/noticia/noticia/defesa-de-dissertacao-de-mestrado-sensitive-content-detection-in-video-with-deep-learning

Defesa de Dissertação de Mestrado da aluna Patricia Ferreira da Silva

Defesa de Dissertação de Mestrado da aluna Patricia Ferreira da Silva

Título da dissertação:
ResRiskOnto: an application ontology for risks in the petroleum reservoir domain

Resumo:
Este trabalho apresenta a Reservoir Risks Ontology (ResRiskOnto), uma ontologia aplicada para riscos na indústria de óleo e gás associados ao domínio de reservatórios. Os blocos utilizados na
construção desta ontologia são termos dominados por profissinais de reservatório, de forma a facilitar sua adoção na documentação futura de riscos.A ResRiskOnto foi desenvolvida tendo como ideia central o conceito de Evento de Risco. Cada evento tem um conjunto de possíveis Participantes, que por sua vez possuem Características manifestadas durante o evento. A ontologia oferece um conjunto de 94 termos, 29 dos quais derivados da classe Evento de Risco.Para o desenvolvimento da ResRiskOnto, conduzimos uma análise semântica em documentos contendo aproximadamente 2500 riscos relacionados a reservatórios descritos em linguagem natural. Este repositório é o resultado de centenas de workshops de avaliação de riscos em projetos de óleo & gás, conduzidos na Petrobras ao longo de uma década.A ontologia aqui apresentada tem seus fundamentos nos princípios da Basic Formal Ontology (BFO). A BFO é uma ontologia de topo, projetada para descrever domínios científicos. Uma de suas características mais marcantes é seu compromisso com o Realismo, uma visão filosófica segundo a qual os entes que constituem o que é real existem independentemente da nossa representação a respeito desses entes. Na camada de domínio as entidades de reservatório são descritas segundo os princípios da GeoCore Ontology, uma ontologia para a Geologia. GeoCore dá suporte ao entendimento geológico, contribuindo assim para elucidar o domínio de Reservatórios. Para validar a ResRiskOnto os documentos do repositório foram anotados utilizando os entes e relações definidos na ontologia, para desenvolvimento de um modelo de processamento em linguagem natural capaz de reconhecer entidades nomeadas e extrair as relações entre elas. Nossa contribuição é uma ontologia aplicada que permite o raciocínio semântico no repositório de documentos de risco. Também esperamos que ela forneça (i) as bases para modelagem de dados no caso de riscos relacionados a reservatórios; e (ii) um padrão para futura documentação de riscos no domínio de reservatório.

Orientador:
Prof. Doutor Helio Côrtes Vieira Lopes

Banca:
Prof. Doutor Rafael Jesus de Moraes
Prof.(a) Doutor(a) Simone Diniz Junqueira Barbosa
Prof. Doutor Regis Kruel Romeo
Prof. Doutor William Paulo Ducca Fernandes

Link: http://www.inf.puc-rio.br/blog/noticia/noticia/defesa-de-dissertacao-de-mestrado-resriskonto-an-application-ontology-for-risks-in-the-petroleum-reservoir-domain

Defesa de doutorado do aluno Antônio José Grandson Busson

Defesa de doutorado do aluno Antônio José Grandson Busson

Título da tese:

A Self-supervised Method for Blind Denoising of Seismic Shot Gathers

Resumo:

Nos últimos anos, a geofísicos tem se dedicado ao aprimoramento da qualidade dos dados sísmicos por meio da atenuação de ruído e interpolação de sismogramas usando métodos puramente baseados em CNN. Métodos baseados em CNN podem alcançar resultados estado-da-arte para remoção de ruídos. No entanto, eles não se aplicam a cenários sem dados de treinamento emparelhados (ou seja, dados sísmicos ruidosos e dados sísmicos sem ruído correspondentes). Neste trabalho, tratamos a atenuação de ruídos de dados sísmicos como um problema de atenuação de ruído cega, que consiste em remover ruídos desconhecidos sem dados pareados. Em outras palavras, a base usada pelo modelo de denoiser é aprendida a partir das próprias amostras ruidosas durante o treinamento. Motivado por este contexto, o principal objetivo deste trabalho é propor um método auto-supervisionado para atenuação cega de dados sísmicos, que não requer análise prévia do sinal sísmico, nenhuma estimativa do ruído e nenhum dado de treinamento pareado.

O método proposto assume dois conjuntos de dados: um contendo shot gathers com ruídos e o outro com shot gathers sem ruídos. A partir desses dados, treinamos dois modelos: (1) Seismic Noise Transfer (SNT), que aprende a produzir shot gathers com ruído sintético contendo o ruído dos shot gathers com ruído e o sinal dos shot gathers sem ruído; E (2) Sismic Neural Denoiser (SND), que aprende a mapear os shot gathers com ruído sintético de volta à coleta aos shot gathers sem ruído original. Após o treinamento, o SND sozinho é usado para remover o ruído das capturas ruidosas originais. Nosso modelo SNT adapta o algoritmo Neural Style Transfer (NST) ao domínio sísmico. Além disso, nosso modelo SND consiste em uma nova arquitetura CNN baseada em fusão de atributos em várias escalas para eliminação de ruído em shot gathers. Nosso método produziu resultados promissores em experimentos, alcançando um ganho de PSNR de 0,9 em comparação com outros modelos de última geração.

Orientador:

Prof(a). Doutor(a) Sérgio Colcher

Banca:

Prof Doutor André Bulcão

Prof Doutor Julio Cesar Duarte

Prof Doutor Marcelo Gatass

Prof Doutor Alberto Barbosa Raposo

Prof Doutor Jônatas Wehrmann

Prof. Doutor Sergio Lifschitz

Prof. Doutor Alan Livio Vasconcelos Guedes

Acompanhe-nos pelo link:

http://www.inf.puc-rio.br/blog/noticia/noticia/defesa-de-tese-de-doutorado-a-self-supervised-method-for-blind-denoising-of-seismic-shot-gathers

Defesa de doutorado do aluno Thales Levi Azevedo Valente

Defesa de doutorado do aluno Thales Levi Azevedo Valente

https://puc-rio.zoom.us/j/95153657421?pwd=OWkvVm9mMzZEQ2RDZnFKN3I1amltQT09

Título da tese:

Method for automatic detection of stamps in scanned documents using deep learning and synthetic data generation by instance augmentation.

Resumo:

Documentos digitalizados em ambientes de negócios substituíram grandes volumes de papéis. Profissionais autorizados usam carimbos para certificar informações críticas nesses documentos. Muitas empresas precisam verificar o carimbo adequado de documentos de entrada e saída. Na maioria das situações de inspeção, as pessoas usam seus próprios olhos para identificar carimbos, e a verificação manual de carimbos é cansativa, suscetível a erros e ineficiente em termos de tempo gasto e resultados esperados. Erros na verificação manual de carimbos podem gerar multas de órgãos reguladores, interrupção de operações e até mesmo comprometer fluxos de trabalho e transações financeiras. Propomos duas técnicas que combinadas podem resolver esse problema automatizando totalmente a detecção de carimbos em documentos digitalizados do mundo real.

Nossas técnicas podem lidar com conjuntos de dados contendo muitos tipos de carimbos minoritários (de tamanho de amostra pequena), com sobreposições, combinações diferentes por página e dados ausentes. Na primeira técnica, propomos uma arquitetura de rede profunda projetada a partir da relação entre os problemas identificados em carimbos do mundo real e os desafios e soluções da tarefa de detecção de objetos apontados na literatura.

Na segunda técnica, propomos um método para aumentar, por exemplo, conjuntos de dados de carimbos a partir de dados reais para investigar se é possível detectar tipos de carimbos com amostras insuficientes.

Avaliamos os hiperparâmetros da abordagem de aumento de instâncias e os resultados obtidos através de um método Deep Explainability. Alcançamos resultados de última geração para a tarefa de detecção de carimbos combinando com sucesso essas duas técnicas.

Orientador:

Prof. Doutor Marcelo Gattas, PUC-Rio

Banca:

Prof. Doutor Paulo Ivson Netto Santos, PUC-Rio

Prof. Doutor Aristófanes Corrêa Silva, UFMA

Prof. Doutor Waldemar Celes Filho, PUC-Rio

Acompanhe-nos também no site:

http://www.inf.puc-rio.br/blog/noticia/noticia/defesa-de-tese-de-doutorado-method-for-automatic-detection-of-stamps-in-scanned-documents-using-deep-learning-and-synthetic-data-generation-by-instance-augmentation