Lógicas e Ontologias: uma proposta nada modesta para o processamento semântico do Português

Profa. Valeria de Paiva

Abstract: Se nós conseguirmos produzir fórmulas lógicas a partir de textos
objetivos em Português, muitas aplicações, tais como extração de
informacões, sumarização, análise de sentimentos, tradução automática,
pesquisa semântica, perguntas e respostas etc. tornam-se factíveis. Mas
essas aplicações requerem muitos recursos léxicos.
Mesmo para a língua inglesa, que possui, por razões óbvias, o maior número
e variedade de recursos léxicos, alguns recursos ainda estão faltando, os
recursos existentes não são bem conectados e muita informação que poderia,
a princípio, ser obtida pela ligação de recursos existentes, não é fácil
de extrair. A situação e muito pior para o português, onde não temos os
grandes e longos projetos que acumularam anos-hora de trabalho de
linguistas tais como WordNet, ComLex, o Penn TreeBank, VerbNet, FrameNet,
GATE, NLTK, Delph-IN, ParGram, GF etc. Junto com colegas eu embarquei num
projeto de construir recursos léxicos semelhantes para o português, a
longo prazo. Nossa estratégia básica é construir tanto quanto possível
automaticamente, mas verificar os resultados obtidos manualmente da melhor
forma que conseguirmos. Essa palestra descreve as ferramentas
implementadas a partir de 2010 (OpenWorNet-PT e NomLex-PT), as que estamos
criando e as que as que planejamos implementar e explica porque elas são
úteis.

www.valeriadepaiva.org/