Defesa de Tese de Doutorado do aluno Jonatas do Santos Grosman
Título da tese: Assessing the Robustness of Large Pre-trained Models in the Speech Recognition
Resumo:
Utilizar representações fornecidas por um grande modelo pré-treinado tornou-se a principal estratégia para alcançar o estado da arte nas mais variadas tarefas. Um grande modelo pré-treinado recentemente proposto, wav2vec 2.0, foi seminal para vários outros trabalhos sobre pré-treinamento de grandes modelos em dados de fala. Muitos modelos estão sendo pré-treinados usando a mesma arquitetura baseada em transformer que o wav2vec 2.0 e estão obtendo o estado da arte em várias tarefas relacionadas à fala. No entanto, poucos trabalhos propuseram maiores investigações sobre a robustez desses modelos. Nosso trabalho visa investigar a robustez desses modelos em dois aspectos diferentes. O primeiro é sobre a transferibilidade entre línguas desses modelos. Nossos experimentos nos mostraram que o tamanho dos dados usados durante o pré-treinamento desses modelos não é tão crucial para a transferibilidade quanto a diversidade. Percebemos que o desempenho das línguas indo-europeias é superior ao das línguas não indo-europeias nos modelos avaliados. Vimos uma transferência positiva de conhecimento entre línguas usando modelos monolinguais, o que foi percebido em todos os idiomas que usamos, mas foi mais evidente quando o idioma usado durante o pré-treinamento era mais semelhante ao idioma do fine-tuning. O segundo aspecto de robustez que investigamos em nosso trabalho é quão bem esses modelos se comportam em cenários de desbalanceamento de dados, onde há um subconjunto mais representativo no conjunto de dados do fine-tuning. Nossos resultados mostraram que o desbalanceamento dos dados no fine-tuning geralmente afeta o resultado final dos modelos, com melhor desempenho nos subconjuntos mais representativos. No entanto, uma maior variabilidade no conjunto de treinamento favorece o desempenho do modelo para um subconjunto mais representativo. Porém essa maior variabilidade nos dados não favoreceu os idiomas não vistos durante o treinamento. Observamos também que em alguns cenários os modelos parecem mais robustos em lidar com o desbalanceamento de gênero do que idade ou sotaque. Com esses achados, esperamos ajudar a comunidade científica na utilização de modelos pré-treinados existentes, bem como auxiliar no pré-treinamento de novos modelos.
Orientador: Prof. Dr. Hélio Côrtes Vieira Lopes
Banca:
Prof. Dr. Cassio Freitas Pereira de Almeida
Prof. Dr. Guilherme Gonçalves Schardong
Prof. Dr. Bruno Feijo
Prof. Dr. Marcus Vinicius Soledade Poggi de Aragao
Prof. Dr. Luiz Carlos Pacheco Rodrigues Velho
Acompanhe-nos também no site: http://www.inf.puc-rio.br/blog/noticia/noticia/defesa-de-tese-de-doutorado-assessing-the-robustness-of-large-pre-trained-models-in-the-speech-recognition
Estamos dando mais uma chance para você entrar na melhor graduação em Computação! Não perca essa chance, as inscrições para o vestibular 2023 da PUC-Rio foram prorrogadas até o dia 19/09 e temos uma série de bolsas, parciais e integrais, para os melhores colocados.
A nova grade da Ciência da Computação, assim como todos os demais cursos do CTC, terão disciplinas de projetos práticos em todos os semestres, desde o início. Estas permitirão que os alunos apliquem os conhecimentos teóricos aprendidos em outras disciplinas do curso a problemas reais, trazidos por profissionais do mercado de várias empresas de TI parceiras. Além disso, serão ensinadas não só competência técnicas como também competências sociais (soft skills).
Ao contrário de outras graduações em Computação oferecidas por outras universidades, o curso de Ciência da Computação prima pela sua qualidade e profundidade. Trata-se de um curso generalista, em que o aluno primeiro aprende todos os principais conceitos, fundamentos, metodologias e princípios tecnológicos da Ciência da Computação e nos últimos semestres pode optar por inúmeras disciplinas optativas e linhas de especialização, como Ciência de Dados, IA, Games, Banco de Dados, Computação Gráfica etc. Além disso, o aluno que esteja interessado em posteriormente fazer um mestrado pode já cursar disciplinas da pós-graduação antecipadamente, e assim diminuir a duração do seu mestrado.
O Departamento de Informática também oferece inúmeras oportunidades de estágio e Iniciação Científica no próprio campus, como em laboratórios de pesquisa (os NITs), o Instituto Tecgraf e no recente laboratório Americanas Futuro Lab Rio, onde todos os 40+ estagiários aprendem métodos ágeis de desenvolvimento de produtos e aplicam esses métodos para desenvolver protótipos de soluções para a Americanas.
Os alunos das redes pública e privada que tiverem mostrado melhor desempenho no vestibular são candidatos a receber uma bolsa de estudos, de 50% ou mais, financiada por fundações e empresas. Para ingressar em 2023 já temos confirmadas aproximadamente 10 bolsas. E no meio do curso, a partir do terceiro ano, alunos com bom desempenho acadêmico poderão também fazer um intercâmbio de três meses até 1 ano em universidades renomadas dos EUA e da Europa, como a UIUC, a Columbia University e a Univ. de Paris, parcialmente financiado.
Nossos alunos egressos são considerados a “nata no mercado” de trabalho de TI brasileiro e internacional, são “caçados” por quase todas as grandes e mais conhecidas empresas nacionais, e muitos de nossos egressos são contratados por empresas mundo afora.
Não perca essa nova chance e se inscreva no vestibular 2023: https://www.puc-rio.br/vestibular/202212/
Quer conhecer mais sobre o curso? Assista ao vídeo: https://www.youtube.com/watch?v=h1959x254u8&list=PLRKeuVfLlY-7YyqBe4gdgciEifd0mTGls
Veja um depoimento de um dos nossos ex-alunos: https://www.youtube.com/watch?v=Ma8789JbTwg&list=PLRKeuVfLlY-6NSbMZHgkk8BNcWka9xrMe
Defesa de Dissertação de Mestrado do aluno Victor Augusto Lima L.
Título da dissertação: TuningChef: uma abordagem para escolher as ações de sintonia fina de banco de dados com melhor custo-benefício
Resumo: Enquanto muitos trabalhos de pesquisa propõem uma forma de listar um conjunto de opções de sintonia fina para uma determinada carga de trabalho, poucos oferecem uma maneira de ajudar o DBA a tomar melhores decisões ao encontrar um conjunto de ações disponíveis, principalmente ao levar em consideração suas próprias. TuningChef é o resultado do desenvolvimento de uma proposta do passo a passo desse processo de decisão. Dado um conjunto de opções de sintonia fina, recomendamos o subconjunto de melhor custo-benefício com contexto suficiente para que o DBA entenda a motivação por trás de cada decisão, com a possibilidade de deixar o usuário construir seu próprio subconjunto e verificar o impacto esperado.
Orientador: Prof. Dr. Sergio Lifschitz
Banca:
Prof. Dr. Javam de Castro Machado
Prof(a) Dr(a) Fernanda Araujo Baião
Prof(a) Dr(a) Juliana Alves Pereira
Prof. Dr. Edward Hermann Haeusler
Acompanhe-nos pelo link: https://puc-rio.zoom.us/j/93725142535?pwd=YXdKdXhxY3BWQmQxU1RHNWkwTXZUdz09
Autor: Lucas Caracas de Figueiredo
Orientador: Waldemar Celes Filho
Data e Hora: 16/09/2022 às 09:00
Entre os dias 19 a 23 de setembro de 2022, ocorrerá a 37a edição do SBBD – Simpósio Brasileiro de Bancos de Dados, no Atlântico Búzios Convention, localizado em Búzios/Rio de Janeiro. Neste ano a coordenação geral está nas mãos do Professor Sérgio Lifschitz, do Departamento de Informática da PUC-Rio.
É um dos evento oficiais e mais tradicionais dentre os promovidos pela Sociedade Brasileira de Computação (SBC), organizado anualmente pela Comissão Especial de Bancos de Dados (CEBD), e envolve as comunidades científica, acadêmica e industrial para debater temas que envolvem ciência e tecnologia voltados para grande área de banco de dados, como ciência de dados e big data. Cabe observar que a 1a edição do SBBD também foi organizada pelo DI PUC-Rio em 1986.
Cabe observar que todos participantes do SBBD 2022 também poderão participar do 15o BSB (Simpósio Brasileiro de Bioinformática). Tanto no SBBD como no BSB há vários alunos (e ex-alunos), além de professores do DI, apresentando artigos selecionados que relatam projetos de pesquisa acontecendo na PUC-Rio.
O simpósio é considerado como a maior conferência brasileira e da América Latina sobre a temática. Confira parte da programação que, além das sessões técnicas para apresentações de artigos selecionados e convidados, terá muita coisa interessante:
Para conferir a programação completa, acompanhe o site SBBD2022 e também as redes sociais do evento:
No dia 13 de setembro de 2022, a medalha Pedro Ernesto, a mais alta comenda do município do Rio de Janeiro, será entregue em uma cerimônia para os criadores da Linguagem Lua. Esta honraria será feita no auditório da PUC-Rio, tendo como presidente da mesa o vereador Marcelo Arar e a presença de Thiago Ramos Dias, secretário municipal de Desenvolvimento Econômico, Inovação e Simplificação.
Criada em 1993 pelos professores Roberto Ierusalimschy e Waldemar Celes, do Departamento de Informática da PUC-Rio, e Luiz Henrique de Figueiredo, do Instituto de Matemática Pura e Aplicada, a linguagem de programação Lua é destaque no cenário mundial, sendo amplamente utilizada na indústria de jogos e sistemas embarcados.
O DI fica honrado com este grande reconhecimento de uma das nossas criações.
Defesa de Dissertação de Mestrado do aluno Lorenzo Palermo Saraiva
Título da dissertação: Quantum algorithms for proof search in linear logic
Resumo: Neste projeto foram desenvolvidos algoritmos quânticos para busca de provas em cálculo de sequentes para a Lógica Linear Conjuntiva Multiplicativa, que é um fragmento da Lógica Linear. Os algoritmos resultantes são todos baseados no algoritmo de Grover, com pequenas diferenças que refletem diferentes formas de abordar a questão. Neste trabalho iremos apresentar e analisar as soluções criadas.
Orientador: Prof. Dr. Edward Hermann Haeusler
Banca:
Prof. Dr. Vaston Gonçalves da Costa
Prof. Dr. Eduardo Sany Laber
Prof. Dr. Marcos Kalinowski
Prof. Dr. Luiz Carlos Pinheiro Dias Pereira
Prof. Dr. Sérgio Colcher
Acompanhe-nos pelo link: https://puc-rio.zoom.us/j/94260680168?pwd=eE41VFpuMEsrdUNjYXFVZ0FuTXR0UT09
Autor: Victor Augusto Lima Lins de Souza
Orientador: Sergio Lifschitz
Data e Hora: 15/09/2022 às 09:30
Local: RDC511
Defesa de Tese de Doutorado do aluno Italo G. Santana
Título da dissertação: Exploring the frontier of Combinatorial Optimization and Machine Learning: Applications to Vehicle routing and Support Vector Machines
Resumo: A otimização combinatória (OC) está presente em inúmeras aplicações práticas (por exemplo, planejamento de produção, programação, logística, etc.). Ao longo dos anos, OC e aprendizado de máquina (AM) surgiram, juntas, como uma área prospectiva de pesquisa para melhorar processos de tomada de decisão. Nesse contexto, há interesse em utilizar algoritmos de AM para melhorar métodos de OC. Por outro lado, como muitas tarefas de AM podem ser reformuladas como problemas de otimização, há um amplo interesse em utilizar métodos de OC para resolver esses problemas. Nesta tese, três estudos que conectam OC e AM em torno de duas aplicações importantes são conduzidos: o problema de roteamento de veículos capacitado (PRVC) e máquinas de vetores de suporte com perda em margem rígida (SVM-HML — do inglês support vector machines with hard-margin loss). No primeiro estudo, uma estratégia para explorar vizinhanças de busca local de alta ordem por mineração de padrões em duas meta-heurísticas estado da arte para o PRVC é proposta. Em um segundo estudo, também no contexto do PRVC, critérios de relacionamento para nós de clientes baseados em saídas de redes neurais em grafos são explorados. Com base nessas saídas, medidas de relação podem ser exploradas para orientar a busca local e estender operadores de cruzamento em um algoritmo genético estado da arte. Por fim, no terceiro estudo, uma abordagem eficiente de programação inteira mista baseada em cortes combinatórios de Benders e estratégias de amostragem são utilizadas para treinar modelos de SVM-HML de maneira mais eficiente.
Orientador: Prof. Dr. Thibaut Victor Gaston Vidal
Banca:
Prof. Dr. Andrea Lodi
Prof. Dr. Artur Alves Pessoa
Prof. Dr. Rafael Martinelli Pinto
Prof. Dr. Marco Serpa Molinaro
Prof. Dr. Eduardo Uchoa Barboza
Prof. Dr. Helio Côrtes Vieira Lopes
Acompanhe-nos também no site: https://puc-rio.zoom.us/j/3457513766?pwd=WExyZFd3dWQ0WkZNUENWSmc3WTYvQT09
Autor: Jonatas dos Santos Grosman
Orientador: Hélio Côrtes Vieira Lopes
Data e Hora: 15/09/2022 às 09:00