Algoritmo criado por aluno do DI em uso no Globoplay é destaque na RecSys

Pesquisa de doutorando Felipe Ferreira foi recebida na conferência e aplicada na indústria em poucos meses

Ainda há quem pense que pesquisa acadêmica e carreira no mercado de trabalho são inconciliáveis. Muito conectado com a indústria e a aplicação, o Departamento de Informática (DI) da PUC-Rio mostra que essa parceria é benéfica para os dois lados. O trabalho do doutorando Felipe Ferreira, orientado pelo professor Hélio Lopes, demonstra que as duas frentes devem atuar juntas em busca de soluções para problemas da vida real.

Formado em Ciência da Computação, Felipe trabalha como pesquisador em machine learning no time de recomendação do Grupo Globo, atualmente  dedicado ao Globoplay (plataforma de streaming). “O foco é otimizar a distribuição desse acervo para os usuários, principalmente visando maximizar suas experiências e expectativas em relação ao conteúdo”, disse. 

Nesse sentido, ele buscou soluções na literatura da pesquisa de doutorado, unindo forças com colegas de trabalho, para explorar as múltiplas características do conteúdo e chegar a um algoritmo de recomendação que impressionou a comunidade – e já está em uso no Globoplay.  “Temos uma escassez de metadados de vídeo e identificamos também que nossos algoritmos de recomendação baseados em conteúdo, especificamente de vídeo, não tinham um bom desempenho. Então, isso nos motivou a buscar alternativas, relacionadas à pesquisa, para que pudéssemos atacar esse problema”, afirmou. 

Segundo Felipe, o objetivo da pesquisa é trazer luz para um problema clássico na literatura de recomendação, chamado “cold start” ou “partida fria”. Diz respeito tanto ao usuário que acaba de assinar o produto – e por isso não se tem informação sobre ele – quanto ao ítem, ou seja, o vídeo publicado recentemente, cujo conteúdo ainda é desconhecido. Explorando as múltiplas modalidades do conteúdo, fica mais fácil recomendar, captar informações e descobrir a preferência do usuário e as nuances de suas mudanças de preferência. 

“Ali dentro tem atores, o mood; tem uma característica visual e um padrão sonoro que se trouxermos para nossos algoritmos teremos uma nova oportunidade de visualização”, ressaltou o pesquisador. Sob a orientação de Hélio e com os coautores do artigo, em alguns meses gerou a primeira interação. Trata-se ainda de uma versão inicial das recomendações, mas já validada por um teste AB e estudo qualitativo com um grupo de usuários. 

O resultado foi além das expectativas. “Elevamos nossas métricas de negócio com esse primeiro resultado preliminar, foi muito impressionante. Comprovamos com o teste AB que o algoritmo trouxe um lift positivo na taxa de clique, no engajamento do usuário e no clique seguido de play”, afirmou Ferreira.

O destaque na RecSys2020

A partir dos excelentes resultados alcançados, Felipe e os coautores do projeto — Daniele Souza, Igor Moura e Matheus Barbieri — o inscreveram na ACM (Association for Computing Machinery) Recommender Systems Conference, a “RecSys”. Uma vitrine das últimas tendências de pesquisa na área, o evento é muito conceituado e teria o Rio de Janeiro como sede pela primeira vez, não fosse a pandemia.

A RecSys aconteceu em formato remoto de 22 a 26 de setembro. A pesquisa de Felipe foi aceita e apresentada duas vezes. “Levamos este trabalho, ainda em fase inicial, e nossa técnica foi considerada uma abordagem nova para ser referência nas novas frentes de pesquisa em recomendação”, disse Felipe. 

Ele se surpreendeu com a curiosidade gerada pelo trabalho na comunidade. “Houve muitas perguntas após nossas apresentações. Perguntaram até quão melhor esse nosso algoritmo é em relação ao do YouTube, por exemplo. Nem chegamos ainda a comparar com esses outros. Foram vários questionamentos e elogios, fiquei muito motivado”, completou. 

Já está disponível no Globoplay

A pesquisa qualitativa foi feita por uma parceria da equipe de AI (inteligência artificial) e de recomendação — em que o Felipe trabalha —, com o time de usabilidade da empresa, na área de pesquisa em UX (experiência do usuário) da Globoplay. Assim que teve acesso aos resultados, a empresa colocou a aplicação em uso.

“Existe uma aba de similares, de onde extraímos e trazemos essa recomendação, baseada nessas múltiplas modalidades. Já está funcionando no Globoplay desde julho. Agora queremos evoluir para cada vez mais causar impacto maior e expandir para outras áreas do produto”, afirmou o doutorando. 

Para Hélio Lopes, orientador do trabalho, a troca de experiências entre a Academia e a Indústria é fundamental para levar o valor da pesquisa para o negócio. “Felipe é um excelente exemplo de motivação de aluno que vem para a academia aprimorar seus conhecimentos e trazer o retorno imediato para o trabalho na empresa. É uma história que vem se repetindo, passa por gerações. Sempre chegam novas pessoas motivadas por problemas reais”, disse.

Data Science: ‘É importante saber falar a língua dos dados’, diz Hélio Lopes, em live

Cientista de dados deve ser criativo, ter mente aberta e analítica, interesse humano e saber negociar

Para atingir a transformação digital, é importantíssimo uma mudança cultural. Foi com esse conceito que o professor Hélio Lopes, do Departamento de Informática (DI) da PUC-Rio, começou sua fala no seminário “Pesquisa em Ciência de Dados: A Escalada para a Valorização dos Dados”, transmitido ao vivo pelo Youtube na última sexta-feira (11). Com mais de 100 participantes conectados simultaneamente, o evento marcou a estreia da série de lives do DI como um sucesso e segue disponível online.

“As empresas estão todas interessadas em transformação digital. Ainda mais agora, neste período de pandemia, em que se verificou que automatizar processos, melhorar a comunicação de uma forma digital entre as pessoas com o uso de tecnologia é algo muito importante”, disse Hélio, ao apresentar o tema. Ele ressaltou “falar a língua dos dados” é hoje, para muitas profissões e setores da indústria, uma habilidade tão necessária quanto foi o domínio da língua inglesa no século passado.

Com o objetivo de transformar dados em informação e esta, por sua vez, em conhecimento, a Data Science — que foi traduzida para o português como “ciência de dados”, mas segundo o professor melhor seria ser chamada de “ciência por dados” — tem múltiplas aplicações. Com diferentes fundamentos e técnicas, abarca desde aplicativos como Waze até um sistema de busca semântica em cenas de novela através de reconhecimento facial. 

“Você cria uma ontologia, um sistema de acesso à base de dados, de forma eficiente. Mas para isso tem que ter um algoritmo que consiga realmente reconstruir sem erro dentro desse contexto o reconhecimento de cada artista em cada cena de todas as novelas do legado que existe na Globo, por exemplo”, disse Hélio. Esse projeto, “Globo Face Stream: A System for Video Meta-data Generation in an Entertainment Industry Setting”, foi desenvolvido pelo DI da PUC-Rio com alunos que atuam na Globo.com e recebeu o prêmio “Best Paper Award Certificate” neste ano.

Habilidades do Cientista de Dados

Lopes disse que, no Departamento de Informática da PUC, “ao formar esses novos cientistas de dados, queremos formar um líder em ciência de dados”. E elencou as habilidades necessárias para esse ideal de profissional, que precisa: 

  • Ter mente aberta
  • Ser criativo
  • Ter interesse humano
  • Ter poder analítico
  • Capacidade de fazer negócios

A combinação desses fatores em um cientista de dados atende ao maior interesse da indústria, que é melhorar seus negócios com o uso de dados para auxiliar as tomadas de decisão, segundo o professor. 

Dando sequência à série de lives do DI, que vai até dezembro, na próxima sexta (18), às 15h, o professor Edward Hermann falará sobre “Compressão de provas lógicas e a conjectura NP=PSPACE”, no YouTube do DI PUC Rio. Não perca!