Fechar

Defesa de Tese de Doutorado do aluno Matheus Telles Werner

Defesa de Tese de Doutorado do aluno Matheus Telles Werner.

Título da Tese: Extracting Section Structure from Resumes in Brazilian Portuguese

Resumo: Esta tese apresenta um novo analisador de currículos projetado para reorganizar o conteúdo textual de qualquer currículo em sua estrutura de seção original. Nosso trabalho aborda dois desafios práticos negligenciados pela literatura existente: (i) garantir a ordem de leitura correta do texto recuperado do arquivo de currículo e (ii) extrair individualmente todas as seções, bem como as subseções de experiências de trabalho e educação. Levando em consideração a observação de que a maioria dos currículos adere a modelos básicos de documentos, reformulamos o problema da ordem de leitura como uma tarefa de identificação de modelos de documento. Nossos experimentos sugerem que mesmo um pequeno modelo amplamente utilizado como o EfficientNet-B0 pode identificar com precisão modelos de documento comuns. Além disso, propomos uma abordagem de rotulação de sequências que identifica simultaneamente todas as seções do currículo e algumas subseções. Implementamos e comparamos duas soluções baseadas nos conhecidos modelos CRF e BERT. Nossa avaliação fornece fortes evidências de que o CRF pode servir como uma alternativa prática ao BERT, dependendo do hardware e das restrições orçamentárias. Eles produzem resultados comparáveis em termos de identificação de seções de currículo, enquanto o BERT demonstra uma vantagem substancial ao identificar as subseções de educação e experiências de trabalho.

Orientador: Prof. Dr. Eduardo Sany Laber

Banca: Alberto Barbosa Raposo | Sérgio Colcher | Alexandre Roberto Renteria | Julio Cesar Duarte | Jose Alberto Rodrigues Pereira Sardinha

Assista a defesa pelo link https://puc-rio.zoom.us/j/95059756485?pwd=bFcxUTJkNmYwR0ROQ0VNOWxPMHpidz09