Antonio Paganelli, aluno de Doutorado do Departamento de Informática da PUC-Rio, apresentou o seu trabalho “A novel self-adaptive method for improving patient monitoring with composite early-warning scores”, na IEEE BigData.
Esta conferência é uma das mais conceituadas na área englobando vários assuntos, tais como: o processamento, o armazenamento, a coleta e a análise de enormes volumes de dados. Após muitas edições, foi a primeira vez que BigData foi realizada fora dos EUA, dessa vez em Osaka, Japão.
Queremos parabenizar o Antônio e todos os co-autores do trabalho por mais essa conquista do Departamento de Informática.
Defesa de Tese de Doutorado do aluno Ian Monteiro Nunes
Título da dissertação: Open-set semantic segmentation for remote sensing images
Resumo: Coletar amostras que esgotam todas as classes possíveis para tarefas do mundo real geralmente é difícil ou até impossível devido a muitos fatores diferentes. Em um cenário realista/viável, os métodos devem estar cientes de que os dados de treinamento estão incompletos e que nem todo o conhecimento está disponível. Neste cenário, em tempo de teste, os métodos desenvolvidos devem ser capazes de identificar as amostras desconhecidas enquanto executam corretamente a tarefa proposta para as classes conhecidas. Os modelos Open-Set Recognition e Semantic Segmentation surgem para lidar com esse tipo de cenário para tarefas de reconhecimento visual e rotulagem densa, respectivamente. Inicialmente, este trabalho propõe uma nova taxonomia com o objetivo de organizar a literatura e fornecer uma compreensão das tendências teóricas que guiaram as abordagens existentes que podem influenciar métodos futuros. A segmentação de conjuntos abertos é uma tarefa relativamente nova e inexplorada, com apenas um punhado de métodos propostos para modelar tais tarefas. Este trabalho também propõe dois métodos distintos para realizar a segmentação semântica de conjunto aberto. Primeiro, um método chamado OpenGMM estende a estrutura OpenPCS usando uma mistura gaussiana de modelos para modelar a distribuição de pixels para cada classe de maneira multimodal. Em segundo lugar, o método de Reconstrução Condicional para Segmentação Semântica de Conjunto Aberto (CoReSeg) aborda o problema usando a reconstrução condicionada por classe das imagens de entrada de acordo com sua máscara de pixel. CoReSeg condiciona cada pixel de entrada para todas as classes conhecidas, esperando erros maiores para pixels de classes desconhecidas. A observação dos resultados qualitativos sugeriu que ambos os métodos propostos produzem melhor consistência semântica em suas previsões do que as linhas de base, resultando em mapas de segmentação mais limpos que se ajustam melhor aos limites dos objetos. Além disso, OpenGMM e CoReSeg superaram os métodos de linha de base de última geração nos conjuntos de dados Vaihingen e Potsdam ISPRS. A terceira abordagem proposta é um procedimento geral de pós-processamento que usa superpixels para forçar regiões altamente homogêneas a se comportarem igualmente, corrigindo pixels classificados errados dentro dessas regiões. Também propusemos um novo método de superpixel chamado FuSC. Todas as abordagens propostas melhoraram os resultados quantitativos e qualitativos para ambos os conjuntos de dados. Além disso, CoReSeg pós-processado com FuSC alcançou resultados de ponta para ambos os conjuntos de dados. A implementação oficial de todas as abordagens propostas está disponível em \url{https://github.com/iannunes}.
Orientador: Marcus Vinicius Soledade Poggi de Aragao
Vocês terão uma nova oportunidade para se inscreverem no programa de pós-graduação em Informática, oferecido pelo Departamento de Informática (DI) da PUC-Rio, pois as inscrições foram prorrogadas para o dia 09 de dezembro de 2022!
O programa foi duplamente pioneiro na área de computação no Brasil: o primeiro a ser criado (em 1967) e o primeiro a receber conceito 7 (máximo) da CAPES — conceito atribuído a instituições que possuem excelência em pesquisa. O conceito 7 foi mantido desde então em todas as avaliações e acaba de ser renovado também na última avaliação, confirmando a excelente produção intelectual e o caráter de vanguarda do programa!?Se você pretende fazer um mestrado ou doutorado na área de computação, se inscrever para o DI da PUC-Rio é sem dúvida uma escolha acertada!
Candidatos ao título de mestre ou doutor em Informática poderão se inscrever nas seguintes linhas de pesquisa: Banco de Dados, Ciência de Dados, Computação Gráfica,?Engenharia de Software, Hipertexto e Multimídia, Interação Humano-Computador, Linguagens de Programação, Otimização e Raciocínio Automático, Redes de Computadores e Sistemas Distribuídos ou Teoria da Computação.
Cada área de concentração tem diversos temas de pesquisa sendo trabalhados, dentre as quais se pode citar: Internet das Coisas e Computação Móvel, Jogos e Entretenimento Digital, Machine Learning, Metaverso e Realidade Virtual Aumentada, Engenharia de Software para Ciência de Dados, entre outras. O DI atua também em temas interdisciplinares, como Bioinformática e Inteligência Artificial (pesquisadas em várias das áreas de concentração do DI).
O programa se situa em uma universidade que é líder em integração com indústria na América Latina e é comum que os alunos tenham oportunidades de atuação em projetos de pesquisa e desenvolvimento durante seus cursos de pós-graduação.
Vocês terão uma nova oportunidade para se inscreverem no programa de pós-graduação em Informática, oferecido pelo Departamento de Informática (DI) da PUC-Rio, pois as inscrições foram prorrogadas para o dia 09 de dezembro de 2022!
O programa foi duplamente pioneiro na área de computação no Brasil: o primeiro a ser criado (em 1967) e o primeiro a receber conceito 7 (máximo) da CAPES — conceito atribuído a instituições que possuem excelência em pesquisa. O conceito 7 foi mantido desde então em todas as avaliações e acaba de ser renovado também na última avaliação, confirmando a excelente produção intelectual e o caráter de vanguarda do programa!?Se você pretende fazer um mestrado ou doutorado na área de computação, se inscrever para o DI da PUC-Rio é sem dúvida uma escolha acertada!
Candidatos ao título de mestre ou doutor em Informática poderão se inscrever nas seguintes linhas de pesquisa: Banco de Dados, Ciência de Dados, Computação Gráfica,?Engenharia de Software, Hipertexto e Multimídia, Interação Humano-Computador, Linguagens de Programação, Otimização e Raciocínio Automático, Redes de Computadores e Sistemas Distribuídos ou Teoria da Computação.
Cada área de concentração tem diversos temas de pesquisa sendo trabalhados, dentre as quais se pode citar: Internet das Coisas e Computação Móvel, Jogos e Entretenimento Digital, Machine Learning, Metaverso e Realidade Virtual Aumentada, Engenharia de Software para Ciência de Dados, entre outras. O DI atua também em temas interdisciplinares, como Bioinformática e Inteligência Artificial (pesquisadas em várias das áreas de concentração do DI).
O programa se situa em uma universidade que é líder em integração com indústria na América Latina e é comum que os alunos tenham oportunidades de atuação em projetos de pesquisa e desenvolvimento durante seus cursos de pós-graduação.
O programa de pós-graduação em Informática (Mestrado e Doutorado), oferecido pelo Departamento de Informática (DI) da PUC-Rio está com inscrições abertas até sexta-feira, dia 25 de novembro de 2022.
O programa foi duplamente pioneiro na área de computação no Brasil: o primeiro a ser criado (em 1967) e o primeiro a receber conceito 7 (máximo) da CAPES — conceito atribuído a instituições que possuem excelência em pesquisa. O conceito 7 foi mantido desde então em todas as avaliações e acaba de ser renovado também na última avaliação, confirmando a excelente produção intelectual e o caráter de vanguarda do programa!?Se você pretende fazer um mestrado ou doutorado na área de computação, se inscrever para o DI da PUC-Rio é sem dúvida uma escolha acertada!
Candidatos ao título de mestre ou doutor em Informática poderão se inscrever nas seguintes linhas de pesquisa: Banco de Dados, Ciência de Dados, Computação Gráfica,?Engenharia de Software, Hipertexto e Multimídia, Interação Humano-Computador, Linguagens de Programação, Otimização e Raciocínio Automático, Redes de Computadores e Sistemas Distribuídos ou Teoria da Computação.
Cada área de concentração tem diversos temas de pesquisa sendo trabalhados, dentre as quais se pode citar: Internet das Coisas e Computação Móvel, Jogos e Entretenimento Digital, Machine Learning, Metaverso e Realidade Virtual Aumentada, Engenharia de Software para Ciência de Dados, entre outras. O DI atua também em temas interdisciplinares, como Bioinformática e Inteligência Artificial (pesquisadas em várias das áreas de concentração do DI).
O programa se situa em uma universidade que é líder em integração com indústria na América Latina e é comum que os alunos tenham oportunidades de atuação em projetos de pesquisa e desenvolvimento durante seus cursos de pós-graduação.
Inscrições abertas para o Mestrado e Doutorado Acadêmico em Informática
Oportunidade!
As inscrições para o programa de pós-graduação em Informática (Mestrado e Doutorado), oferecido pelo Departamento de Informática (DI) da PUC-Rio estão abertas e ficarão disponíveis até o dia 25 de novembro de 2022!
O programa foi duplamente pioneiro na área de computação no Brasil: o primeiro a ser criado (em 1967) e o primeiro a receber conceito 7 (máximo) da CAPES — conceito atribuído a instituições que possuem excelência em pesquisa. O conceito 7 foi mantido desde então em todas as avaliações e acaba de ser renovado também na última avaliação, confirmando a excelente produção intelectual e o caráter de vanguarda do programa!?Se você pretende fazer um mestrado ou doutorado na área de computação, se inscrever para o DI da PUC-Rio é sem dúvida uma escolha acertada!
Candidatos ao título de mestre ou doutor em Informática poderão se inscrever nas seguintes linhas de pesquisa: Banco de Dados, Ciência de Dados, Computação Gráfica,?Engenharia de Software, Hipertexto e Multimídia, Interação Humano-Computador, Linguagens de Programação, Otimização e Raciocínio Automático, Redes de Computadores e Sistemas Distribuídos ou Teoria da Computação.
Cada área de concentração tem diversos temas de pesquisa sendo trabalhados, dentre as quais se pode citar: Internet das Coisas e Computação Móvel, Jogos e Entretenimento Digital, Machine Learning, Metaverso e Realidade Virtual Aumentada, Engenharia de Software para Ciência de Dados, entre outras. O DI atua também em temas interdisciplinares, como Bioinformática e Inteligência Artificial (pesquisadas em várias das áreas de concentração do DI).
O programa se situa em uma universidade que é líder em integração com indústria na América Latina e é comum que os alunos tenham oportunidades de atuação em projetos de pesquisa e desenvolvimento durante seus cursos de pós-graduação.Para mais informações veja o edital no site: http://www.inf.puc-rio.br/pos-graduacao/
Defesa de Tese de Doutorado do aluno Lucas Caracas de Figueiredo
Título da tese: Deep-Learning-Based Shape Matching Framework on 3D CAD Models
Resumo:
Modelos CAD 3D ricos em dados são essenciais durante os diferentes estágios do ciclo de vida de projetos de engenharia. Devido à recente popularização da metodologia BIM e do uso de Gêmeos Digitais para a manufatura inteligente, a quantidade de detalhes, o tamanho, e a complexidade desses modelos aumentaram significativamente. Apesar desses modelos serem compostos de várias geometrias repetidas, os softwares de projeto de plantas geralmente não proveem nenhuma informação de instanciação. Trabalhos anteriores demonstraram que removendo a redundância na representação dos modelos CAD 3D reduz significativamente o armazenamento e requisição de memória deles, ao passo que facilita otimizações de renderização. Este trabalho propõe um arcabouço para correspondência de formas baseado em aprendizado profundo que minimiza as informações redundantes de um modelo CAD 3D a esse respeito. Nos apoiamos nos avanços recentes no processamento profundo de nuvens de pontos, superando desvantagens de trabalhos anteriores, como a forte dependência da ordenação dos vértices e topologia das malhas de triângulos. O arcabouço desenvolvido utiliza nuvens de pontos uniformemente amostradas para identificar similaridades entre malhas em modelos CAD 3D e computam uma matriz de transformação afim ótima para instancia-las. Resultados em modelos CAD 3D reais demonstram o valor do arcabouço proposto. O procedimento de registro de nuvem de pontos desenvolvido atinge um erro de superfície menor, ao mesmo tempo que executa mais rápido que abordagens anteriores. A abordagem supervisionada de classificação desenvolvida atingiu resultados equivalentes em comparação com métodos limitados anteriores e os superou significativamente num cenário de embaralhamento de vértices. Propomos também uma abordagem não supervisionada que agrupa malhas semelhantes e supera a necessidade de rotular explicitamente as geometrias no modelo CAD 3D. Este método não supervisionado obtém resultados competitivos quando comparados às abordagens anteriores, até mesmo superando-os em determinados cenários.
Defesa de Tese de Doutorado do aluno Jonatas do Santos Grosman
Título da tese: Assessing the Robustness of Large Pre-trained Models in the Speech Recognition
Resumo:
Utilizar representações fornecidas por um grande modelo pré-treinado tornou-se a principal estratégia para alcançar o estado da arte nas mais variadas tarefas. Um grande modelo pré-treinado recentemente proposto, wav2vec 2.0, foi seminal para vários outros trabalhos sobre pré-treinamento de grandes modelos em dados de fala. Muitos modelos estão sendo pré-treinados usando a mesma arquitetura baseada em transformer que o wav2vec 2.0 e estão obtendo o estado da arte em várias tarefas relacionadas à fala. No entanto, poucos trabalhos propuseram maiores investigações sobre a robustez desses modelos. Nosso trabalho visa investigar a robustez desses modelos em dois aspectos diferentes. O primeiro é sobre a transferibilidade entre línguas desses modelos. Nossos experimentos nos mostraram que o tamanho dos dados usados durante o pré-treinamento desses modelos não é tão crucial para a transferibilidade quanto a diversidade. Percebemos que o desempenho das línguas indo-europeias é superior ao das línguas não indo-europeias nos modelos avaliados. Vimos uma transferência positiva de conhecimento entre línguas usando modelos monolinguais, o que foi percebido em todos os idiomas que usamos, mas foi mais evidente quando o idioma usado durante o pré-treinamento era mais semelhante ao idioma do fine-tuning. O segundo aspecto de robustez que investigamos em nosso trabalho é quão bem esses modelos se comportam em cenários de desbalanceamento de dados, onde há um subconjunto mais representativo no conjunto de dados do fine-tuning. Nossos resultados mostraram que o desbalanceamento dos dados no fine-tuning geralmente afeta o resultado final dos modelos, com melhor desempenho nos subconjuntos mais representativos. No entanto, uma maior variabilidade no conjunto de treinamento favorece o desempenho do modelo para um subconjunto mais representativo. Porém essa maior variabilidade nos dados não favoreceu os idiomas não vistos durante o treinamento. Observamos também que em alguns cenários os modelos parecem mais robustos em lidar com o desbalanceamento de gênero do que idade ou sotaque. Com esses achados, esperamos ajudar a comunidade científica na utilização de modelos pré-treinados existentes, bem como auxiliar no pré-treinamento de novos modelos.
Orientador: Prof. Dr. Hélio Côrtes Vieira Lopes
Banca:
Prof. Dr. Cassio Freitas Pereira de Almeida
Prof. Dr. Guilherme Gonçalves Schardong
Prof. Dr. Bruno Feijo
Prof. Dr. Marcus Vinicius Soledade Poggi de Aragao
Defesa de Tese de Doutorado do aluno Italo G. Santana
Título da dissertação: Exploring the frontier of Combinatorial Optimization and Machine Learning: Applications to Vehicle routing and Support Vector Machines
Resumo: A otimização combinatória (OC) está presente em inúmeras aplicações práticas (por exemplo, planejamento de produção, programação, logística, etc.). Ao longo dos anos, OC e aprendizado de máquina (AM) surgiram, juntas, como uma área prospectiva de pesquisa para melhorar processos de tomada de decisão. Nesse contexto, há interesse em utilizar algoritmos de AM para melhorar métodos de OC. Por outro lado, como muitas tarefas de AM podem ser reformuladas como problemas de otimização, há um amplo interesse em utilizar métodos de OC para resolver esses problemas. Nesta tese, três estudos que conectam OC e AM em torno de duas aplicações importantes são conduzidos: o problema de roteamento de veículos capacitado (PRVC) e máquinas de vetores de suporte com perda em margem rígida (SVM-HML — do inglês support vector machines with hard-margin loss). No primeiro estudo, uma estratégia para explorar vizinhanças de busca local de alta ordem por mineração de padrões em duas meta-heurísticas estado da arte para o PRVC é proposta. Em um segundo estudo, também no contexto do PRVC, critérios de relacionamento para nós de clientes baseados em saídas de redes neurais em grafos são explorados. Com base nessas saídas, medidas de relação podem ser exploradas para orientar a busca local e estender operadores de cruzamento em um algoritmo genético estado da arte. Por fim, no terceiro estudo, uma abordagem eficiente de programação inteira mista baseada em cortes combinatórios de Benders e estratégias de amostragem são utilizadas para treinar modelos de SVM-HML de maneira mais eficiente.
Orientador: Prof. Dr. Thibaut Victor Gaston Vidal
Banca:
Prof. Dr. Andrea Lodi
Prof. Dr. Artur Alves Pessoa
Prof. Dr. Rafael Martinelli Pinto
Prof. Dr. Marco Serpa Molinaro
Prof. Dr. Eduardo Uchoa Barboza
Prof. Dr. Helio Côrtes Vieira Lopes
Acompanhe-nos também no site: https://puc-rio.zoom.us/j/3457513766?pwd=WExyZFd3dWQ0WkZNUENWSmc3WTYvQT09
Defesa de Tese de Doutorado do aluno Angelo Batista Neves Junior
Título da dissertação: Automatic Generation of Benchmarks for Evaluating Keyword and Natural Language Interfaces to RDF Datasets
Resumo: Os sistemas de busca textual fornecem aos usuários uma alternativa amigável para acessar datasets RDF (Resource Description Framework). A avaliação de desempenho de tais sistemas requer benchmarks adequados, consistindo de datasets RDF, consultas e respectivas respostas esperadas. No entanto, os benchmarks disponíveis geralmente possuem poucas consultas e respostas incompletas, principalmente porque são construídos manualmente com a ajuda de especialistas. A contribuição central desta tese é um método para construir benchmarks automaticamente, com um maior número de consultas e com respostas mais completas. O método proposto aplica-se tanto a consultas baseadas em palavras-chave quanto em linguagem natural e possui duas partes: geração de consultas e geração de respostas. A geração de consultas seleciona um conjunto de entidades relevantes, chamadas de indutores, e, para cada uma, heurísticas orientam o processo de extração de consultas relacionadas. A geração de respostas recebe as consultas produzidas no passo anterior e computa geradores de solução (SG), subgrafos do dataset original contendo diferentes respostas às consultas. Heurísticas também orientam a construção dos SGs evitando o desperdício de recursos computacionais na geração de respostas irrelevantes.
Orientador: Prof. Dr. Marco Antonio Casanova
Banca:
Prof. Dr. Luiz André Portes Paes Leme
Prof. Dr. Geraldo Bonorino Xexéo
Prof(a) Dr(a) Vânia Maria Ponte Vidal
Prof. Dr. Antonio Luz Furtado
Prof(a) Dr(a) Melissa Lemos Cavaliére
Prof. Dr. José Antonio Fernandes de Macêdo
Prof(a) Dr(a) Simone Diniz Junqueira Barbosa
Acompanhe-nos também pelo link: https://puc-rio.zoom.us/j/93760975741?pwd=YXVNcUQzTTlNa2ZlOVhyd1BhLzkwdz09