Fechar
Categorias 2:


Defesa de Tese de Doutorado do aluno Jonatas do Santos Grosman
quarta-feira, 14 de setembro de 2022 às 11:48

Defesa de Tese de Doutorado do aluno Jonatas do Santos Grosman

Título da tese: Assessing the Robustness of Large Pre-trained Models in the Speech Recognition

Resumo: 

Utilizar representações fornecidas por um grande modelo pré-treinado tornou-se a principal estratégia para alcançar o estado da arte nas mais variadas tarefas. Um grande modelo pré-treinado recentemente proposto, wav2vec 2.0, foi seminal para vários outros trabalhos sobre pré-treinamento de grandes modelos em dados de fala. Muitos modelos estão sendo pré-treinados usando a mesma arquitetura baseada em transformer que o wav2vec 2.0 e estão obtendo o estado da arte em várias tarefas relacionadas à fala. No entanto, poucos trabalhos propuseram maiores investigações sobre a robustez desses modelos. Nosso trabalho visa investigar a robustez desses modelos em dois aspectos diferentes. O primeiro é sobre a transferibilidade entre línguas desses modelos. Nossos experimentos nos mostraram que o tamanho dos dados usados durante o pré-treinamento desses modelos não é tão crucial para a transferibilidade quanto a diversidade. Percebemos que o desempenho das línguas indo-europeias é superior ao das línguas não indo-europeias nos modelos avaliados. Vimos uma transferência positiva de conhecimento entre línguas usando modelos monolinguais, o que foi percebido em todos os idiomas que usamos, mas foi mais evidente quando o idioma usado durante o pré-treinamento era mais semelhante ao idioma do fine-tuning. O segundo aspecto de robustez que investigamos em nosso trabalho é quão bem esses modelos se comportam em cenários de desbalanceamento de dados, onde há um subconjunto mais representativo no conjunto de dados do fine-tuning. Nossos resultados mostraram que o desbalanceamento dos dados no fine-tuning geralmente afeta o resultado final dos modelos, com melhor desempenho nos subconjuntos mais representativos. No entanto, uma maior variabilidade no conjunto de treinamento favorece o desempenho do modelo para um subconjunto mais representativo. Porém essa maior variabilidade nos dados não favoreceu os idiomas não vistos durante o treinamento. Observamos também que em alguns cenários os modelos parecem mais robustos em lidar com o desbalanceamento de gênero do que idade ou sotaque. Com esses achados, esperamos ajudar a comunidade científica na utilização de modelos pré-treinados existentes, bem como auxiliar no pré-treinamento de novos modelos.

 

Orientador: Prof. Dr. Hélio Côrtes Vieira Lopes

Banca: 

Prof. Dr. Cassio Freitas Pereira de Almeida

Prof. Dr. Guilherme Gonçalves Schardong

Prof. Dr. Bruno Feijo

Prof. Dr. Marcus Vinicius Soledade Poggi de Aragao

Prof. Dr. Luiz Carlos Pacheco Rodrigues Velho

Acompanhe-nos também no site: http://www.inf.puc-rio.br/blog/noticia/noticia/defesa-de-tese-de-doutorado-assessing-the-robustness-of-large-pre-trained-models-in-the-speech-recognition

 

 



Vestibular 2023 – Inscrições prorrogadas
terça-feira, 13 de setembro de 2022 às 14:12

Estamos dando mais uma chance para você entrar na melhor graduação em Computação! Não perca essa chance, as inscrições para o vestibular 2023 da PUC-Rio foram prorrogadas até o dia 19/09 e temos uma série de bolsas, parciais e integrais, para os melhores colocados. 

A nova grade da Ciência da Computação, assim como todos os demais cursos do CTC, terão disciplinas de projetos práticos em todos os semestres, desde o início. Estas permitirão que os alunos apliquem os conhecimentos teóricos aprendidos em outras disciplinas do curso a problemas reais, trazidos por profissionais do mercado de várias empresas de TI parceiras. Além disso, serão ensinadas não só competência técnicas como também competências sociais (soft skills).

Ao contrário de outras graduações em Computação oferecidas por outras universidades, o curso de Ciência da Computação prima pela sua qualidade e profundidade. Trata-se de um curso generalista, em que o aluno primeiro aprende todos os principais conceitos, fundamentos, metodologias e princípios tecnológicos da Ciência da Computação e nos últimos semestres pode optar por inúmeras disciplinas optativas e linhas de especialização, como Ciência de Dados, IA, Games, Banco de Dados, Computação Gráfica etc. Além disso, o aluno que esteja interessado em posteriormente fazer um mestrado pode já cursar disciplinas da pós-graduação antecipadamente, e assim diminuir a duração do seu mestrado.

O Departamento de Informática também oferece inúmeras oportunidades de estágio e Iniciação Científica no próprio campus, como em laboratórios de pesquisa (os NITs), o Instituto Tecgraf e no recente laboratório Americanas Futuro Lab Rio, onde todos os 40+ estagiários aprendem métodos ágeis de desenvolvimento de produtos e aplicam esses métodos para desenvolver protótipos de soluções para a Americanas.

Os alunos das redes pública e privada que tiverem mostrado melhor desempenho no vestibular são candidatos a receber uma bolsa de estudos, de 50% ou mais, financiada por fundações e empresas. Para ingressar em 2023 já temos confirmadas aproximadamente 10 bolsas. E no meio do curso, a partir do terceiro ano, alunos com bom desempenho acadêmico poderão também fazer um intercâmbio de três meses até 1 ano em universidades renomadas dos EUA e da Europa, como a UIUC, a Columbia University e a Univ. de Paris, parcialmente financiado.

Nossos alunos egressos são considerados a “nata no mercado” de trabalho de TI brasileiro e internacional, são “caçados” por quase todas as grandes e mais conhecidas empresas nacionais, e muitos de nossos egressos são contratados por empresas mundo afora.

Não perca essa nova chance e se inscreva no vestibular 2023: https://www.puc-rio.br/vestibular/202212/

Quer conhecer mais sobre o curso? Assista ao vídeo: https://www.youtube.com/watch?v=h1959x254u8&list=PLRKeuVfLlY-7YyqBe4gdgciEifd0mTGls

Veja um depoimento de um dos nossos ex-alunos: https://www.youtube.com/watch?v=Ma8789JbTwg&list=PLRKeuVfLlY-6NSbMZHgkk8BNcWka9xrMe

 



Defesa de Dissertação de Mestrado do aluno Victor Augusto Lima L.
terça-feira, 13 de setembro de 2022 às 12:40

Defesa de Dissertação de Mestrado do aluno Victor Augusto Lima L.

Título da dissertação: TuningChef: uma abordagem para escolher as ações de sintonia fina de banco de dados com melhor custo-benefício

Resumo: Enquanto muitos trabalhos de pesquisa propõem uma forma de listar um conjunto de opções de sintonia fina para uma determinada carga de trabalho, poucos oferecem uma maneira de ajudar o DBA a tomar melhores decisões ao encontrar um conjunto de ações disponíveis, principalmente ao levar em consideração suas próprias. TuningChef é o resultado do desenvolvimento de uma proposta do passo a passo desse processo de decisão. Dado um conjunto de opções de sintonia fina, recomendamos o subconjunto de melhor custo-benefício com contexto suficiente para que o DBA entenda a motivação por trás de cada decisão, com a possibilidade de deixar o usuário construir seu próprio subconjunto e verificar o impacto esperado.

Orientador: Prof. Dr. Sergio Lifschitz

Banca: 

Prof. Dr.  Javam de Castro Machado

Prof(a) Dr(a) Fernanda Araujo Baião

Prof(a) Dr(a) Juliana Alves Pereira

Prof. Dr. Edward Hermann Haeusler

Acompanhe-nos pelo link:  https://puc-rio.zoom.us/j/93725142535?pwd=YXdKdXhxY3BWQmQxU1RHNWkwTXZUdz09



Defesa de Tese de Doutorado: Deep-Learning-Based Shape Matching Framework on 3D CAD Models
segunda-feira, 12 de setembro de 2022 às 15:37

Autor: Lucas Caracas de Figueiredo

Orientador: Waldemar Celes Filho

Data e Hora: 16/09/2022 às 09:00



SBBD 2022: saiba as principais informações sobre o evento
sexta-feira, 9 de setembro de 2022 às 17:46

Entre os dias 19 a 23 de setembro de 2022, ocorrerá a 37a edição do SBBD – Simpósio Brasileiro de Bancos de Dados, no Atlântico Búzios Convention, localizado em Búzios/Rio de Janeiro. Neste ano a coordenação geral está nas mãos do Professor Sérgio Lifschitz, do Departamento de Informática da PUC-Rio.

 

É um dos evento oficiais e mais tradicionais dentre os promovidos pela Sociedade Brasileira de Computação (SBC), organizado anualmente pela Comissão Especial de Bancos de Dados (CEBD), e envolve as comunidades científica, acadêmica e industrial para debater temas que envolvem ciência e tecnologia voltados para grande área de banco de dados, como ciência de dados e big data. Cabe observar que a 1a edição do SBBD também foi organizada pelo DI PUC-Rio em 1986.

 

Cabe observar que todos participantes do SBBD 2022 também poderão participar do 15o BSB (Simpósio Brasileiro de Bioinformática). Tanto no SBBD como no BSB há vários alunos (e ex-alunos), além de professores do DI, apresentando artigos selecionados que relatam projetos de pesquisa acontecendo na PUC-Rio.

O simpósio é considerado como a maior conferência brasileira e da América Latina sobre a temática. Confira parte da programação que, além das sessões técnicas para apresentações de artigos selecionados e convidados, terá muita coisa interessante: 

 

  • Keynote speakers: Carmem Hara (UFPR), Julia Stoyanovich (New York University), Ihab Ilyas (University of Waterloo);

 

  • Tutoriais:
    • Angelo Brayner (UFC), José Maria Monteiro Filho (UFC) e Arlino Henrique Araújo (UFPI): “Estratégias para Recuperação de Main Memory Databases
    • Alberto Lerner (Univ. Fribourg ) e Philippe Bonnet (Univ. Copenhagen): “Not your Grandpa’s SSD: The Era of Co-Designed Storage Devices

 

  • Minicursos:
    • José Eduardo Machado e Felipe Nunes (Neo4J): “Introdução à plataforma de grafos Neo4J
    • Helena Caseli (UFSCar), Cláudia Freitas (PUC-Rio) e Roberto Viola (Kunumi): “Processamento de Linguagem Natural
    • Angelo Frozza (IFC), Geomar Schreiner (UNOESC) e Ronaldo Mello (UFSC): “Projeto de Bancos de Dados NoSQL
    • Gustavo Coutinho, Bárbara Oliveira, Lucas Gaspar, João Araújo e José Macêdo (UFC): “Uso de Meta-Learning em Tarefas de Aprendizado Profundo

 

  • Workshops co-localizados:
    • DB+AI (Workshop de Integração BD com Inteligência Artificial)
    • DSW (Dataset Showcase Workshop)
    • DEXEA (Data Driven Extreme Events Analytics)

Para conferir a programação completa, acompanhe o site SBBD2022 e também as redes sociais do evento: 

 

 



Criadores da Linguagem Lua receberão a medalha Pedro Ernesto
sexta-feira, 9 de setembro de 2022 às 12:05

No dia 13 de setembro de 2022, a medalha Pedro Ernesto, a mais alta comenda do município do Rio de Janeiro, será entregue em uma cerimônia para os criadores da Linguagem Lua. Esta honraria será feita no auditório da PUC-Rio, tendo como presidente da mesa o vereador Marcelo Arar e a presença de Thiago Ramos Dias, secretário municipal de Desenvolvimento Econômico, Inovação e Simplificação. 

Criada em 1993 pelos professores Roberto Ierusalimschy e Waldemar Celes, do Departamento de Informática da PUC-Rio, e Luiz Henrique de Figueiredo, do Instituto de Matemática Pura e Aplicada, a linguagem de programação Lua é destaque no cenário mundial, sendo amplamente utilizada na indústria de jogos e sistemas embarcados. 

O DI fica honrado com este grande reconhecimento de uma das nossas criações. 



Defesa de Dissertação de Mestrado do aluno Lorenzo Palermo Saraiva
sexta-feira, 9 de setembro de 2022 às 11:19

Defesa de Dissertação de Mestrado do aluno Lorenzo Palermo Saraiva

Título da dissertação: Quantum algorithms for proof search in linear logic

Resumo: Neste projeto foram desenvolvidos algoritmos quânticos para busca de provas em cálculo de sequentes para a Lógica Linear Conjuntiva Multiplicativa, que é um fragmento da Lógica Linear. Os algoritmos resultantes são todos baseados no algoritmo de Grover, com pequenas diferenças que refletem diferentes formas de abordar a questão. Neste trabalho iremos apresentar e analisar as soluções criadas.

Orientador: Prof. Dr. Edward Hermann Haeusler

Banca: 

Prof. Dr. Vaston Gonçalves da Costa

Prof. Dr. Eduardo Sany Laber

Prof. Dr. Marcos Kalinowski

Prof. Dr. Luiz Carlos Pinheiro Dias Pereira

Prof. Dr. Sérgio Colcher

Acompanhe-nos pelo link: https://puc-rio.zoom.us/j/94260680168?pwd=eE41VFpuMEsrdUNjYXFVZ0FuTXR0UT09

 



Defesa de Dissertação de Mestrado: TuningChef: uma abordagem para escolher as ações de sintonia fina de banco de dados com melhor custo-benefício
sexta-feira, 9 de setembro de 2022 às 08:36

Autor: Victor Augusto Lima Lins de Souza

Orientador: Sergio Lifschitz

Data e Hora: 15/09/2022 às 09:30

Local: RDC511



Defesa de Tese de Doutorado do aluno Italo G. Santana
quinta-feira, 8 de setembro de 2022 às 17:15

Defesa de Tese de Doutorado do aluno Italo G. Santana

Título da dissertação: Exploring the frontier of Combinatorial Optimization and Machine Learning: Applications to Vehicle routing and Support Vector Machines

Resumo: A otimização combinatória (OC) está presente em inúmeras aplicações práticas (por exemplo, planejamento de produção, programação, logística, etc.). Ao longo dos anos, OC e aprendizado de máquina (AM) surgiram, juntas, como uma área prospectiva de pesquisa para melhorar processos de tomada de decisão. Nesse contexto, há interesse em utilizar algoritmos de AM para melhorar métodos de OC. Por outro lado, como muitas tarefas de AM podem ser reformuladas como problemas de otimização, há um amplo interesse em utilizar métodos de OC para resolver esses problemas. Nesta tese, três estudos que conectam OC e AM em torno de duas aplicações importantes são conduzidos: o problema de roteamento de veículos capacitado (PRVC) e máquinas de vetores de suporte com perda em margem rígida (SVM-HML  — do inglês support vector machines with hard-margin loss). No primeiro estudo, uma estratégia para explorar vizinhanças de busca local de alta ordem por mineração de padrões em duas meta-heurísticas estado da arte para o PRVC é proposta. Em um segundo estudo, também no contexto do PRVC, critérios de relacionamento para nós de clientes baseados em saídas de redes neurais em grafos são explorados. Com base nessas saídas, medidas de relação podem ser exploradas para orientar a busca local e estender operadores de cruzamento em um algoritmo genético estado da arte. Por fim, no terceiro estudo, uma abordagem eficiente de programação inteira mista baseada em cortes combinatórios de Benders e estratégias de amostragem são utilizadas para treinar modelos de SVM-HML de maneira mais eficiente.

Orientador: Prof. Dr. Thibaut Victor Gaston Vidal

Banca: 

Prof. Dr.  Andrea Lodi

Prof. Dr. Artur Alves Pessoa

Prof. Dr. Rafael Martinelli Pinto

Prof. Dr. Marco Serpa Molinaro

Prof. Dr. Eduardo Uchoa Barboza

Prof. Dr. Helio Côrtes Vieira Lopes

Acompanhe-nos também no site: https://puc-rio.zoom.us/j/3457513766?pwd=WExyZFd3dWQ0WkZNUENWSmc3WTYvQT09

 

 



Defesa de Tese de Doutorado: Assessing the Robustness of Large Pre-trained Models in the Speech Recognition
quinta-feira, 8 de setembro de 2022 às 16:38

Autor: Jonatas dos Santos Grosman

Orientador: Hélio Côrtes Vieira Lopes

Data e Hora: 15/09/2022 às 09:00