Professor apresentou modelos de machine teaching no último seminário do ciclo de lives da pós-graduação em 2020
O Machine Learning (aprendizado de máquina) desperta muito interesse tanto na academia quanto na indústria, sobretudo por suas impressionantes aplicações, como por exemplo os carros autônomos e o processamento de linguagem natural. “De uns seis anos para cá houve alguns breakthroughs (descobertas) nessa área”, afirmou o professor Eduardo Sany Laber no seminário “Topics in Learning: Machine Teaching and Explainability”, apresentado na sexta-feira (4). A palestra marcou a última rodada do ciclo de lives da pós-graduação do Departamento de Informática da PUC-Rio em 2020, e segue disponível no canal do DI no YouTube.
Laber falou sobre os tópicos que vêm sendo estudados na comunidade de machine learning, e ressaltou a relevância da machine explainability. “É importante hoje em dia ter o entendimento do porquê de esses sistemas baseados em inteligência artificial funcionarem de uma maneira e não de outra. Isso pode dar segurança no uso dessas tecnologias”, disse. O pesquisador mostrou o modelo mais usual de estudar learning, chamado passive machine learning. E falou também sobre active learning, que é um outro modelo bastante usado.
“A ideia de machine teaching surgiu nos anos 90, na comunidade de teoria de machine learning. Mas, de alguns anos para cá pesquisadores começaram a perceber que isso pode ter conexões com outros modelos de learning e a ver potencial de aplicações disso”, declarou Laber.
Teaching na teoria e na prática
O objetivo em machine teaching é escolher os exemplos, o “training set” que o algoritmo de aprendizado tem que ter para aprender de forma mais eficiente, com menos exemplos. A partir do modelo chamado “teaching a black box learner”, proposto por pesquisadores da universidade de San Diego, Laber e seus colaboradores aplicaram em sua pesquisa a principal técnica de conectar o problema de teaching com um problema clássico em otimização combinatória que é o set cover online.
“Se guiarmos o nosso aprendizado, podemos aprender mais rápido ou com menos exemplos. O resultado que se tem com esse modelo é essencialmente o melhor possível. Na nossa pesquisa, o que fizemos foi estender esse modelo para torná-lo menos restritivo. Um dos modelos que propusemos e analisamos é o ‘smooth transition learner’, em que o learner faz transições suaves. Com esse modelo o learner tem uma convergência mais rápida”, explicou.
Além das contribuições teóricas de seu trabalho, Laber também fez alguns experimentos computacionais com 12 datasets e dois tipos de learner: random forest e LGBM. Os resultados revelaram que há vantagem no set cover teatcher em relação ao passive machine learning, no sentido que o primeiro requer menos exemplos. E observou também que essa vantagem fica mais significativa quando são targets mais altos de acurácia são considerados.
LEIA TAMBÉM:
Tese e dissertação de alunos do DI são premiadas em concurso do SBQS 2020
Vidal está entre os pesquisadores mais influentes do mundo
Garcia: ‘A degradação de software deve ser monitorada de forma eficiente’
Já em relação à explainability, o pesquisador estuda o problema de clustering, que é um problema clássico e tem uma série de aplicações em análises de dados. “Estamos trabalhando nesse modelo para avançar o conhecimento nesse problema. E a pergunta principal que estamos tentando responder é: quanto pagamos por ser explicável? É isso que estamos buscando entender matematicamente e do ponto de vista prático”, afirmou.
Laber respondeu às perguntas enviadas via chat ao vivo e anunciou que foi convidado a apresentar outra de suas pesquisas na Latin 2020, a principal conferência da teoria/ algoritmos da América Latina. O evento acontecerá em 6 de janeiro de 2021 às 13:40.
O ciclo de lives da pós-graduação do DI volta no próximo semestre. Todas as palestras seguem disponíveis para serem assistidas a qualquer momento, pelo canal do YouTube. Se inscreva no canal para ser informado das próximas!