Fechar

Defesa de Tese de Doutorado do aluno Francisco Sergio de Freitas Filho

Defesa de Tese de Doutorado do aluno Francisco Sergio de Freitas Filho.

Título da tese:Aprendizado com Restrição de Tempo: Problemas de Classificação”

Resumo: Com a crescente quantidade de dados sendo gerados e coletados, torna-se mais comum cenários em que se dispõe de dados rotulados em larga escala, mas com recursos computacionais limitados, de modo que não seja possível treinar modelos preditivos utilizando todas as amostras disponíveis. Diante dessa realidade,adotamos o paradigma de Machine Teaching como uma alternativa para obter modelos eficazes utilizando um subconjunto representativo dos dados disponíveis.Inicialmente, consideramos um problema central da área de Machine Teaching que consiste em encontrar o menor conjunto de amostras necessário para obter uma dada hipótese alvo h*. Adotamos o modelo de ensino black-box learner introduzido em (DASGUPTA et al., 2019), em que o ensino é feito interativamente sem qualquer conhecimento sobre o algoritmo do \textit{learner} e sua classe de hipóteses, exceto que ela contém a hipótese alvo h*. Refinamos alguns resultados existentes para esse modelo e estudamos variantes dele. Em particular, estendemos um resultado de(DASGUPTA et al., 2019) para o cenário mais realista em que h* pode não estar contido na classe de hipóteses do learner e, portanto, o objetivo do teacher é fazer o learner convergir para a melhor aproximação disponível de h*. Também consideramos o cenário com black-box learners não adversários e mostramos que podemos obter melhores resultados para o tipo de learner que se move para a Departamento de Informática, PUC-Rio Página 2 de 4 Formulário para Marcação de Defesa – Doutorado Próxima hipótese de maneira suave, preferindo hipóteses que são mais próximas da hipótese atual.Em seguida, abordamos o problema de Aprendizado com Restrição de Tempo considerando um cenário em que temos um enorme conjunto de dados e um limite de tempo para treinar um dado learner usando esse conjunto. Propomos o método TCT, um algoritmo para essa tarefa, desenvolvido com base nos princípios de Machine Teaching. Apresentamos um estudo experimental envolvendo 5 diferentes learners e 20 datasets no qual mostramos que TCT supera métodos alternativos considerados. Finalmente, provamos garantias de aproximação para uma versão simplificada do TCT.

Orientador: Prof. Dr. Eduardo Sany Laber

Co-orientador: Prof Dr. Marco Serpa Molinaro

Banca: 

Prof. Dr. Fabio Andre Machado Porto

Prof. Dr. Bianca Zadrozny

Prof. Dr. Edward Hermann Haeusler

Prof. Dr. Diego Parente Paiva Mesquita

Prof. Dr. Jose Alberto Rodrigues Pereira Sardinha

Prof. Dr. Sérgio Colcher

Assista a defesa pelo link: https://puc-rio.zoom.us/j/91012978004?pwd=dS9OWGJ1MlR6QytMVnhkYlpUcGE1QT09