Defesa de Dissertação de Mestrado do aluno Matheus Adler Soares Pinto.
Título da dissertação: A Method for Real-TimeGenerationofVideokefromvídeostreaming
Resumo: Sistemas tradicionais de karaokê frequentemente dependem de faixas de videoke pré-gravadas e estáticas, limitando a espontaneidade e personalização da experiência de karaokê. Esta dissertação propõe um método que busca romper com essas restrições, apresentando uma abordagem inovadora para a geração em tempo real de videoke (karaoke com vídeo) a partir de fontes de streaming de vídeo. O processo central, conhecido como Gerador de Videoke, gera eficientemente segmentos de videoke combinando métodos de processamento de vídeo e áudio. O método começa com o Módulo Separador, que divide o vídeo de música em segmentos correspondentes de vídeo e áudio, permitindo um processamento granular. O passo crucial de separação vocal segue, em que os segmentos de áudio individuais são processados usando o Modelo Pré-Treinado Demucs. Essa separação extrai os elementos vocais e de acompanhamento, um aspecto crucial na criação de videoke. Em seguida, os segmentos vocais são convertidos em transcrições precisas usando o Modelo Pré-Treinado Faster-Whisper, incorporando o CTranslate2 para inferência otimizada. As transcrições são enriquecidas com marcações de tempo em nível de palavra para aprimorar a sincronização das legendas. As transcrições, juntamente com suas marcações de tempo, são usadas para sincronizar as legendas com o vídeo usando um script especializado no Módulo SRT para gerar automaticamente arquivos SubRip (SRT). Essa sincronização inclui o destaque em nível de palavra para melhorar a percepção das legendas. Finalmente, o vídeo, as legendas e o acompanhamento musical são combinados em um segmento de videoke usando o FFMPEG, que serve como saída final para cada segmento durante o processo de geração automática de videoke. O método proposto aborda eficientemente o desafio de processar streams de vídeo em tempo real, permitindo uma comunicação contínua entre o servidor e o usuário, implementando um mecanismo de buffer para iniciar o processamento. Dessa forma, a exibição do videoke pode começar mesmo antes que o processamento completo do vídeo seja concluído, resultando em baixa latência. Essa abordagem em tempo real oferece uma solução abrangente e inovadora, proporcionando uma experiência de karaokê personalizada e sincronizada para os usuários.
Orientador: Prof. Dr. Sérgio Colcher
Banca: Julio Cesar Duarte | Antonio José Grandson Busson
Assista a defesa pelo link:
https://puc-rio.zoom.us/j/95830425817?pwd=aDdEMDRURWxnRDlLYlUzaXVKdzNiZz09
Autor: Matheus Moraes Ferreira
Orientador: Alberto Barbosa Raposo
Data e Hora: 02/10/2023 às 09:30
Local: Auditório do Tecgraf 6º andar
Modalidade: Hibrida
Defesa de Tese de Doutorado do aluno Matheus Telles Werner.
Título da Tese: Extracting Section Structure from Resumes in Brazilian Portuguese
Resumo: Esta tese apresenta um novo analisador de currículos projetado para reorganizar o conteúdo textual de qualquer currículo em sua estrutura de seção original. Nosso trabalho aborda dois desafios práticos negligenciados pela literatura existente: (i) garantir a ordem de leitura correta do texto recuperado do arquivo de currículo e (ii) extrair individualmente todas as seções, bem como as subseções de experiências de trabalho e educação. Levando em consideração a observação de que a maioria dos currículos adere a modelos básicos de documentos, reformulamos o problema da ordem de leitura como uma tarefa de identificação de modelos de documento. Nossos experimentos sugerem que mesmo um pequeno modelo amplamente utilizado como o EfficientNet-B0 pode identificar com precisão modelos de documento comuns. Além disso, propomos uma abordagem de rotulação de sequências que identifica simultaneamente todas as seções do currículo e algumas subseções. Implementamos e comparamos duas soluções baseadas nos conhecidos modelos CRF e BERT. Nossa avaliação fornece fortes evidências de que o CRF pode servir como uma alternativa prática ao BERT, dependendo do hardware e das restrições orçamentárias. Eles produzem resultados comparáveis em termos de identificação de seções de currículo, enquanto o BERT demonstra uma vantagem substancial ao identificar as subseções de educação e experiências de trabalho.
Orientador: Prof. Dr. Eduardo Sany Laber
Banca: Alberto Barbosa Raposo | Sérgio Colcher | Alexandre Roberto Renteria | Julio Cesar Duarte | Jose Alberto Rodrigues Pereira Sardinha
Assista a defesa pelo link https://puc-rio.zoom.us/j/95059756485?pwd=bFcxUTJkNmYwR0ROQ0VNOWxPMHpidz09
Defesa de Tese de Doutorado do aluno Bernardo Pinto de Alkmim.
Título da Tese: Law and Order(ing): Providing a Natural Deduction System and Non-monotonic Reasoning to an Intuitionistic Description Logic
Resumo: A lógica descritiva intuicionista iALC foi criada para modelar e raciocinar sobre o domínio de Leis baseada na Jurisprudência Kelseniana \cite{kelsen2005}. No decorrer da década anterior, essa lógica foi usada de diversas maneiras para modelar normas ou formalizar raciocínio jurídico \cite{HPR:2010b,depaiva2011,depaiva2011b,ebl-2014,ialc2016,d
fino2017,xaila-2018,mestradoialc,aicol2020}. Neste trabalho pretendemos complementar trabalhos anteriores ralizados com essa lógica ao preencher algumas lacunas encontradas enquanto trabalhando com ela. A primeira lacuna ocorre por iALC não ter um modo intuitivo de explicar raciocínio nela realizado para pessoas fora do domínio da Lógica. Ela tem um Cálculo de Sequentes (CS) \cite{ialc2016} correto e completo (com respeito a modelos conceituais intuitionistas \cite{depaiva2011}) que tem sido menos usado que o desejado, e isso se dá em grande parte devido à maneira pouco intuitiva com que CS representa provas \cite{jaskowski34}. Apresentamos um sistema de Dedução Natural (DN) correto e completo (com respeito a validade de TBox para modelos conceituais intuicionistas) e com normalização para compensar por essa dificuldade em explicar CS para não-lógicos, especialmente aqueles vindos do domínio legal, que são essenciais para nossa linha de pesquisa. A segunda lacuna envolve não poder lidar com raciocínio não-monotônico (RNM). Em geral, utiliza-se raciocínio não-monotônico, no qual, se é possível concluir algo de um conjunto de premissas, não há como acrescentar outra premissa de modo a evitar a conclusão prévia. Isso não é o caso em um julgamento legal, por exemplo, no qual lados opostos buscam convencer um juiz ou júri de consequências opostas ao adicionar premissas diferentes ao caso em questão. Propomos uma extensão de iALC para lidar com raciocínio não-monotônico (RNM) a fim de representar raciocínio jurídico em outras facetas da Lei como o processo judicial, que é não-monotonico por natureza. Detalhamos mais a motivação tanto para o sistema de DN quanto a extensão de RNM, assim como as decisões tomadas ao criar cada um.
Orientador: Prof. Dr. Edward Hermann Haeusler
Banca: Marco Antonio Casanova | Clarisse Sieckenius de Souza | Ivan José Varzinczak | Renata Wassermann |
Assista a defesa pelo link: https://puc-rio.zoom.us/j/93164012413?pwd=a21tNzRhaTFVQTdYanRQT3VnMXVWUT09
Autor: Paulo Henrique Cardoso Alves
Orientador: Hélio Côrtes Vieira Lopes
Data e Hora: 29/09/2023 às 13:00
Autor: Matheus Adler Soares Pinto
Orientador: Sérgio Colcher
Data e Hora: 28/09/2023 às 18:00
Defesa de Dissertação de Mestrado do aluno Dayson Nywton C. R. do Nascimento
Título da dissertação: Sumarização de artigos científicos em Português no domínio da Saúde.
Dia e horário: Dia 22 de setembro de 2023, às 14h
Resumo: Neste trabalho, apresentamos um estudo sobre o fine-tuning de um LLM (Modelo de Linguagem Amplo ou Large Language Model) pré-treinado para a sumarização abstrata de textos longos em português. Para isso, construímos um corpus contendo uma coleção de 7.450 artigos científicos na área de ciências da saúde em português. Utilizamos esse corpus para ajustar o modelo BERT pré-treinado para o português brasileiro (BERTimbau). Em condições semelhantes, também treinamos um segundo modelo baseado em Memória de Longo Prazo e Recorrência (LSTM) do zero, para fins de comparação. Nossa avaliação mostrou que o modelo ajustado obteve pontuações ROUGE mais altas, superando o modelo baseado em LSTM em 30 pontos no F1-score. A superioridade do modelo ajustado também destaca a importância dos modelos pré-treinados em uma ampla coleção de conteúdo textual geral para obter um melhor desempenho em tarefas específicas de domínio.
Orientador: Prof. Dr. Helio Côrtes Vieira Lopes.
Banca: Prof. Dr. Cassio Freitas Pereira de Almeida | Prof. Dr. Marcos Kalinowski | Prof. Dr. Jonatas dos Santos Grosman
Assista a defesa pelo link:
https://puc-rio.zoom.us/j/95862810471?pwd=YTZwa0VUM2ZxSHJGMGx1L0VGRjIxdz09
Defesa de Tese de Doutorado do aluno Diogo Munaro Vieira.
Título da tese: Uma Nova Abordagem em Camadas para Representação de Dados Biológicos e suas Aplicações
Resumo: A identificação e categorização de proteínas homólogas são tarefas fundamentais no campo da biologia, que dependem de ferramentas que analisam sequências de nucleotídeos ou aminoácidos. No entanto, a detecção automatizada de padrões evolutivos, assim como outras características, usando métodos tradicionais, apresenta desafios. Neste estudo, propomos uma nova abordagem de representação de dados em camadas, que explora padrões evolutivos e outras características de sequências na busca por homólogos, classificação e agrupamento por meio de um processo livre de alinhamento, através de algoritmos de similaridade. Para aprimorar a eficácia dessa abordagem, introduzimos neste trabalho três algoritmos de similaridade especialmente adaptados para comparar dados biológicos nessa representação de dados. Esses algoritmos utilizam técnicas inspiradas na percepção humana para capturar similaridades dentro das representações de moléculas biológicas. Avaliações experimentais demonstram um ótimo desempenho e alta precisão em comparação com abordagens existentes. Essa abordagem em camadas se mostra promissora na identificação de proteínas, principalmente homólogas distantes.
Além disso, esse método sugere relevância para o desenvolvimento de novos métodos e algoritmos de aprendizado de máquina em bioinformática que colaborem com a privacidade e segurança de dados biológicos.
Orientador: Prof. Dr. Sergio Lifschitz
Banca: Edward Hermann Haeusler | Sérgio Colcher | Rafael Dias Mesquita | João Carlos Setubal
Assista a defesa no RDC 511 da PUC-Rio
Autor: Matheus Telles Werner
Orientador: Eduardo Sany Laber
Data e Hora: 27/09/2023 às 14:00
Defesa de Dissertação de Mestrado do aluno Santiago Stiven Vallejo Silva.
Título da dissertação: Uma abordagem centrada em dados para aprimoramento da segmentação de aprendizado profundo do músculo peitoral em imagens de mamografia
Resumo: A segmentação semântica das estruturas anatômicas em imagens de mamografia desempenha um papel significativo no suporte da análise médica. Esta tarefa pode ser abordada com o uso de um modelo de aprendizado de máquina, que deve ser capaz de identificar e delinear corretamente as estruturas. No entanto, identificar o músculo peitoral é frequentemente um desafio, especialmente na visão craniocaudal (CC), devido ao seu tamanho variável, possíveis ausências e sobreposição de tecido fibroglandular. Para enfrentar esse desafio, este trabalho propõe uma abordagem centrada em dados para melhorar o desempenho do modelo de segmentação na papila mamária e no músculo peitoral. Especificamente, aprimorando os dados de treinamento e as anotações em duas etapas.A primeira etapa é baseada em modificações nas anotações. Foram desenvolvidos algoritmos para buscar automaticamente anotações fora do comum dependendo da sua forma. Com estas anotações encontradas foi feita uma revisão e correção manual. A segunda etapa envolve um Downsampling do conjunto de dados, reduzindo as amostras do set de treinamento. Foram analisados os casos de falsos positivos e falsos negativos, identificando as imagens que fornecem informações confusas para posteriormente removê-las do conjunto. Em seguida, foram treinados modelos usando os dados de cada etapa e foram obtidas as métricas de classificação para o músculo peitoral em vista CC e também o IoU para cada estrutura nas vistas CC e MLO.Os resultados do treinamento mostram uma melhora progressiva na identificação e segmentação do músculo peitoral em vista CC e uma melhora na papila em vista MLO, mantendo as métricas de segmentação para as demais estruturas.
Orientador: Prof. Dr. Alberto Barbosa Raposo
Banca: Carlos Roberto Hall Barbosa | Paulo Ivson Netto Santos | Cesar Augusto Sierra Franco
Assista a defesa pelo link: https://puc-rio.zoom.us/j/91819841502?pwd=TG1PeUhQMnlVVVBocEUrK29PaHZ2QT09