Algoritmo criado por aluno do DI em uso no Globoplay é destaque na RecSys

Pesquisa de doutorando Felipe Ferreira foi recebida na conferência e aplicada na indústria em poucos meses

Ainda há quem pense que pesquisa acadêmica e carreira no mercado de trabalho são inconciliáveis. Muito conectado com a indústria e a aplicação, o Departamento de Informática (DI) da PUC-Rio mostra que essa parceria é benéfica para os dois lados. O trabalho do doutorando Felipe Ferreira, orientado pelo professor Hélio Lopes, demonstra que as duas frentes devem atuar juntas em busca de soluções para problemas da vida real.

Formado em Ciência da Computação, Felipe trabalha como pesquisador em machine learning no time de recomendação do Grupo Globo, atualmente  dedicado ao Globoplay (plataforma de streaming). “O foco é otimizar a distribuição desse acervo para os usuários, principalmente visando maximizar suas experiências e expectativas em relação ao conteúdo”, disse. 

Nesse sentido, ele buscou soluções na literatura da pesquisa de doutorado, unindo forças com colegas de trabalho, para explorar as múltiplas características do conteúdo e chegar a um algoritmo de recomendação que impressionou a comunidade – e já está em uso no Globoplay.  “Temos uma escassez de metadados de vídeo e identificamos também que nossos algoritmos de recomendação baseados em conteúdo, especificamente de vídeo, não tinham um bom desempenho. Então, isso nos motivou a buscar alternativas, relacionadas à pesquisa, para que pudéssemos atacar esse problema”, afirmou. 

Segundo Felipe, o objetivo da pesquisa é trazer luz para um problema clássico na literatura de recomendação, chamado “cold start” ou “partida fria”. Diz respeito tanto ao usuário que acaba de assinar o produto – e por isso não se tem informação sobre ele – quanto ao ítem, ou seja, o vídeo publicado recentemente, cujo conteúdo ainda é desconhecido. Explorando as múltiplas modalidades do conteúdo, fica mais fácil recomendar, captar informações e descobrir a preferência do usuário e as nuances de suas mudanças de preferência. 

“Ali dentro tem atores, o mood; tem uma característica visual e um padrão sonoro que se trouxermos para nossos algoritmos teremos uma nova oportunidade de visualização”, ressaltou o pesquisador. Sob a orientação de Hélio e com os coautores do artigo, em alguns meses gerou a primeira interação. Trata-se ainda de uma versão inicial das recomendações, mas já validada por um teste AB e estudo qualitativo com um grupo de usuários. 

O resultado foi além das expectativas. “Elevamos nossas métricas de negócio com esse primeiro resultado preliminar, foi muito impressionante. Comprovamos com o teste AB que o algoritmo trouxe um lift positivo na taxa de clique, no engajamento do usuário e no clique seguido de play”, afirmou Ferreira.

O destaque na RecSys2020

A partir dos excelentes resultados alcançados, Felipe e os coautores do projeto — Daniele Souza, Igor Moura e Matheus Barbieri — o inscreveram na ACM (Association for Computing Machinery) Recommender Systems Conference, a “RecSys”. Uma vitrine das últimas tendências de pesquisa na área, o evento é muito conceituado e teria o Rio de Janeiro como sede pela primeira vez, não fosse a pandemia.

A RecSys aconteceu em formato remoto de 22 a 26 de setembro. A pesquisa de Felipe foi aceita e apresentada duas vezes. “Levamos este trabalho, ainda em fase inicial, e nossa técnica foi considerada uma abordagem nova para ser referência nas novas frentes de pesquisa em recomendação”, disse Felipe. 

Ele se surpreendeu com a curiosidade gerada pelo trabalho na comunidade. “Houve muitas perguntas após nossas apresentações. Perguntaram até quão melhor esse nosso algoritmo é em relação ao do YouTube, por exemplo. Nem chegamos ainda a comparar com esses outros. Foram vários questionamentos e elogios, fiquei muito motivado”, completou. 

Já está disponível no Globoplay

A pesquisa qualitativa foi feita por uma parceria da equipe de AI (inteligência artificial) e de recomendação — em que o Felipe trabalha —, com o time de usabilidade da empresa, na área de pesquisa em UX (experiência do usuário) da Globoplay. Assim que teve acesso aos resultados, a empresa colocou a aplicação em uso.

“Existe uma aba de similares, de onde extraímos e trazemos essa recomendação, baseada nessas múltiplas modalidades. Já está funcionando no Globoplay desde julho. Agora queremos evoluir para cada vez mais causar impacto maior e expandir para outras áreas do produto”, afirmou o doutorando. 

Para Hélio Lopes, orientador do trabalho, a troca de experiências entre a Academia e a Indústria é fundamental para levar o valor da pesquisa para o negócio. “Felipe é um excelente exemplo de motivação de aluno que vem para a academia aprimorar seus conhecimentos e trazer o retorno imediato para o trabalho na empresa. É uma história que vem se repetindo, passa por gerações. Sempre chegam novas pessoas motivadas por problemas reais”, disse.

Hermann aliou ciências exatas e humanas para resolver problema de 40 anos na computação

Pesquisador apresentou prova completa da resolução em live nesta sexta-feira (18)

A união entre as ciências exatas e humanas foi o caminho para a prova completa de  um problema de complexidade computacional que estava há mais de 40 anos em aberto. Nesta segunda live da série do Departamento de Informática da PUC-Rio, o professor Edward Hermann mostrou o resultado de um trabalho de pesquisa de 10 anos, no seminário “Compressão da provas lógicas e a conjectura NP=PSPACE”.

“Não sou mais assim, mas a gente, de exatas, normalmente menospreza a área de humanas. E isso é um crime, porque este resultado só existe graças a essa área e ao trabalho que eu tenho com o colega da Filosofia, o Luis Carlos Pereira. Ele foi meu professor e me ensinou tudo isso”, afirmou Hermann, no seminário nesta sexta-feira (18).

A pesquisa do professor do DI da PUC-Rio impactou o mundo da computação e era grande a expectativa de pesquisadores, professores e alunos para conferir a prova completa a que ele chegou, ao lado do pesquisador Lew Gordeev, da University of Tübingen. Durante a live, o professor recebeu elogios pelo ótimo trabalho e pela didática na apresentação.

Partindo da resolução de binômios de segundo grau – que se aprende no Ensino Fundamental -, Hermann apresentou o método teórico de sua pesquisa, aplicando o teorema da redundância para comprimir provas, e mostrou o passo a passo de como chegar ao CoNP=NP. “Finalmente, conseguimos provar a igualdade dessas duas classes”, disse. Depois da explicação, resumiu em poucas palavras sua descoberta com a pesquisa. “Se eu tenho uma prova muito grande, tem de ser redundante. E, se é redundante, pode ser reduzida.”

A palestra de Hermann está disponível no canal do DI do YouTube, assim como a de Hélio Lopes, que falou sobre Ciência de Dados, na estreia da série de lives do Departamento. Na próxima sexta (25), o professor Marco Antonio Casanova fará o seminário “Selected Topics on the Web-of-Data and Data Integration”. Não perca!

Hermann apresenta pesquisa que impressionou o mundo da computação, nesta sexta (18)

Resultado alcançado em parceria com Lew Gordeev, da University of Tübingen, é tema da segunda edição da série de lives do DI

No universo da complexidade computacional, há problemas que permanecem por décadas sem solução. E um deles estava há mais de 40 anos em aberto, até que a pesquisa realizada pelos professores Edward Hermann, do Departamento de Informática da PUC-Rio, e Lew Gordeev, da University of Tübingen — uma das onze universidades alemãs do German Initiative for Excellence in Research —, conseguiu fechá-lo com uma prova completa. 

Na sexta-feira (18), em live transmitida pelo youtube do DI às 15h, Hermann apresentará o trabalho, publicado no periódico científicoBulletin of the Section of Logic”, que impactou a comunidade da área. No seminário “Compressão de provas lógicas e a conjectura NP=PSPACE”, o professor vai mostrar o resultado da pesquisa. “É um problema que ficou aberto durante algum tempo. Usamos as técnicas de uma área que veio da fundamentação da matemática e da filosofia e acabou parando na computação”, explicou.

O público poderá verificar ao vivo como a prova é validada na palestra, que relaciona diferentes temas, como a teoria da prova, lógica e algoritmos. “Ao conseguir mostrar que provas na lógica proposicional podem ser curtas sempre, você prova que CONP está dentro de NP. E a principal ferramenta para demonstrar isso foi perceber que provas grandes, que demandam muito tempo na verificação, têm seu grau de redundância proporcional ao seu tamanho”, disse Hermann.

Esta é a segunda semana da série de lives do DI, que estreou sexta (11), com o professor Hélio Lopes apresentando o seminário “Pesquisa em Ciência de Dados: A Escalada para a Valorização dos Dados”. O evento alcançou mais de 100 pessoas assistindo simultaneamente e segue disponível no canal do DI no Youtube. Não perca o próximo, dia 18 às 15h!