Defesa de Tese de Doutorado do aluno Fernando Alberto C dos Santos Jr
Título da dissertação:
Extracting Reliable Information From Large Collections of Legal Decisions Resumo: Como uma consequência natural da digitalização do sistema judiciário brasileiro, um grande e crescente número de documentos jurídicos tornou-se disponível na internet, especialmente decisões judiciais. Como ilustração, em 2020, o Judiciário brasileiro produziu 25 milhões de decisões. Neste mesmo ano, o Supremo Tribunal Federal (STF), a mais alta corte do judiciário brasileiro, produziu 99.5 mil decisões. Alinhados a esses valores, observamos uma demanda crescente por estudos voltados para a extração e exploração do conhecimento jurídico de grandes acervos de documentos legais. Porém, ao contrário do conteúdo de textos comuns (como por exemplo, livro, notícias e postagem de blog), o texto jurídico constitui um caso particular de uso de uma linguagem altamente convencionalizada. Infelizmente, pouca atenção é dada à extração de informações em domínios especializados, como textos legais. Do ponto de vista temporal, o Judiciário é uma instituição em constante evolução, que se molda para atender às demandas da sociedade. Com isso, o nosso objetivo é propor um processo confiável de extração de informações jurídicas de grandes acervos de documentos jurídicos, tomando como base o STF e as decisões individuais publicadas por este tribunal nos anos entre 2000 e 2018. Para tanto, pretendemos explorar a combinação de diferentes técnicas de Processamento de Linguagem Natural (PLN) e Ciência de Dados (CD) para extração de informações jurídicas. Da PNL, pretendemos explorar as estratégias automatizadas de reconhecimento de entidades nomeadas no domínio legal. Do ponto da CD, pretendemos explorar a modelagem dinâmica de tópicos utilizando a decomposição tensorial como ferramenta para investigar mudanças no raciocinio juridico presente nas decisões ao lonfo do tempo, a partir da evolução do textos e da presença de entidades nomeadas legais. Para avaliar a confiabilidade, exploramos a interpretabilidade do método empregado, e adicionamos recursos visuais para facilitar a interpretação por parte de um especialista de domínio. Como resultado final, a proposta de um processo confiável e de baixo custo para subsidiar novos estudos no domínio jurídico e, também, propostas de novas estratégias de extração de informações em um grande acervo de documentos.
Orientador:
Prof. Dr. Helio Côrtes Vieira Lopes
Banca:
Prof. Dr. Ivar Alberto Martins Hartmann
Prof. Dr. Guilherme da Franca Couto Fernandes de Almeida
Prof. Dr. Marcus Vinicius Soledade Poggi de Aragão
Prof(a) Dr(a) Simone Diniz Junqueira Barbosa
Prof. Dr. Cassio Freitas Pereira de Almeida
Prof. Dr. Bruno Feijó
Link: https://puc-rio.zoom.us/j/95384213147?pwd=SUNtYVhXS1M3RWQ3UFY1eUd6SmppQT09