O Globo destaca o uso de ‘big data’ no esporte

DI desenvolve diversos projetos na área de Ciência de Dados em parceria com a indústria

 

Vem de longe o protagonismo do Departamento de Informática (DI) da PUC-Rio no desenvolvimento de tecnologias ligadas à ciência de dados e nas parcerias com a indústria. Os programas do DI destacam-se na América Latina, segundo o estudo inglês Times Higher University Impact Rankings, no que diz respeito ao ‘desenvolvimento da indústria, inovação e infraestrutura’. 

 

Este tipo de emprego dos recursos tecnológicos foi destaque nesta segunda-feira (21) na reportagem “Esporte e inovação: Ciência de Dados guia decisões da performance ao marketing, mas precisa chegar à alta gestão”, do jornal O Globo. O texto mostra como estratégias de sucesso podem ser traçadas a partir do uso intensivo da big data, técnica que atribui inteligência aos dados. 

 

O professor do DI Hélio Lopes é um dos coordenadores do grupo de Ciência de Dados ExACTA, iniciativa que engloba os laboratórios daslab, IDEIAS-SERG, Galgos e LES e desenvolve projetos com a indústria em diferentes áreas, como finanças, seguros, entretenimento e óleo e gás. Lopes lembra que o DI tem atuado fortemente neste último setor, trabalhando desde geofísica e geologia, para exploração de recursos, até informações referentes à logística, ao planejar a distribuição. Mas a Ciência de Dados pode contribuir com qualquer área, inclusive no esporte, como mostra a reportagem de O Globo.

 

O professor destaca que as indústrias têm suas demandas específicas, e cada parte do processo requer tecnologias diversas. “Com a crescente demanda da indústria para transformação digital, o principal passo para o sucesso é colocar os dados no centro de tudo. A Ciência de Dados veio para fazer essa transformação. Isso quer dizer olharmos para o tripé pessoas-processos-tecnologia que existe em cada indústria. Os dados são a forma como esses elementos do tripé se comunicam”, explica Lopes.

 

Leia a matéria completa do jornal O Globo:

 

Desde 2002, quando o beisebol mostrou ao mundo como utilizar estatística e ciência de dados para ganhar o jogo, o esporte aprendeu que a vitória pode advir da revelação de um padrão de comportamento até então desconhecido do adversário. Isso é aplicado em modalidades diversas. Por exemplo, um jogador de vôlei, de 1,98m, que salta 3,50m e impulsiona uma bola para atingir a velocidade de 150km/h, é um adversário que impõe respeito. Entretanto, uma equipe técnica pode diagnosticar que esse atleta recorrentemente utiliza o lado esquerdo da rede para cortar no ponto decisivo e assim traçar estratégias mais eficientes de defesa.

 

No alto rendimento, isso só é possível com o uso intensivo da ciência de dados, ou “big data”, técnica que atribui inteligência aos dados. No entanto, o uso dessas informações vai muito além do jogo, sendo responsável também por decisões que permeiam a alta gestão e as estratégias de marketing.

 

A ciência de dados é uma área do conhecimento que combina vários campos: estatística, método científico e análise com objetivo de extrair inteligência dos dados — ou “valor”, como chamam os especialistas. Ela chegou ao esporte para responder as demandas das equipes técnicas por informações que pudessem melhorar de forma contínua a performance do elenco e personalizar o conhecimento sobre os adversários. Com o tempo, criou-se um outro tipo de rivalidade, uma disputa acirrada e milionária entre as equipes por dados que o oponente não possua. Desta forma, cientistas e analistas de dados tornaram-se profissionais imprescindíveis. O primeiro coleta as informações de fontes diversas para fazer predições, encontrar padrões e inferir sobre a resolução de problemas. O analista é mais aplicado e específico, trabalha com ferramentas voltadas à inteligência dos negócios. Seu objetivo é interpretar dados e produzir indicadores de desempenho.

 

Expansão e limites

O uso dos dados no esporte de elite começou na performance e depois passou para o marketing. Agora, pouco a pouco, essas áreas começam a pressionar a alta gestão pela implantação de uma estratégia de dados para tomada de decisão. Tem sido assim no Brasil e foi desta forma em grande parte do mundo.

 

Na área técnica, a ciência de dados chegou através de empresas que desenvolvem soluções específicas para várias modalidades. Entre as mais utilizadas estão a Wyscout, Instat e SportCode. A disseminação dessas plataformas universalizou o acesso às informações e, consequentemente, inteligência passou a ser a capacidade de produzir uma informação diferenciada, customizada e secreta. Por esse motivo, as organizações com mais recursos, além de utilizarem as plataformas, têm seus próprios bancos de dados voltados a orientar seus profissionais.

 

Já a área de marketing, impactada pela indústria do entretenimento, precisou adotar ciência de dados para multiplicar sua base de fãs através do uso intensivo de mídias sociais e canais de streaming. Prioritariamente, foram adotadas rotinas com base em business analytics, um conceito que descreve a exploração dos dados de uma organização, com ênfase na análise estatística.

 

Com a base de fãs crescendo, multiplicou-se a geração de novas oportunidades comerciais e a dependência tecnológica das organizações esportivas para conquista dessa nova fonte de recursos, com objetivo de transformar cada fã em cliente (um mundo onde algoritmos decidem onde colocar um banner, por exemplo).

 

No marketing do esporte brasileiro, o uso da ciência de dados tem se tornado mais comum. As equipes mais ricas têm seus próprios profissionais. Já aquelas com orçamento mais restrito terceirizam o tratamento de dados visando responder perguntas para engajar seu fã. Essas ideias valem para tênis, vôlei, surfe, basquete… No futebol, chama atenção uma força nordestina emergindo com Bahia, Fortaleza, Sport, Santa Cruz e CSA, que já utilizam inteligência de dados para engajar seus torcedores e simpatizantes, modernizando estratégias de marketing e aumentando a base de sócio-torcedor e vendas através de ações comerciais.

 

No Brasil, a aplicabilidade da ciência de dados na gestão é pouco explorada. Em grandes clubes fora do país, é realidade como ferramenta para tomada de decisão; já chegou ao topo da organização e, hoje, discute-se como, quanto e quando começarão a pagar aos fãs pelos dados utilizados. No Brasil, o assunto terá protagonismo por dois motivos. Primeiro, não há caminho de volta. Segundo, com a promulgação da Lei Geral de Proteção de Dados em 2018 e sua vigência iniciada em março do ano passado, as organizações esportivas poderão escolher entre o amor e a dor para acelerar suas curvas de aprendizado: ou através da geração de conhecimento ou pelo doloroso pagamento de multas.

 

Mundo pós-pandemia

O desafio da nova gestão esportiva é pós-moderno. Essa é a nova etapa de desenvolvimento da nossa sociedade, não somente do mundo do esporte. É um ponto de virada quando passamos a utilizar tecnologia para gerar inteligência.

 

No esporte do mundo pós-pandemia — quando o caixa está abalado e o aumento da receita requer a entrada maciça do capital privado — sairá na frente quem conseguir mais rapidamente se adaptar aos novos modelos de negócios que serão baseados no uso intensivo de tecnologia para geração de novas receitas. Será necessário investir na educação dos gestores, na integração das áreas e na contratação de especialistas para que essa “inteligência pós-moderna” se faça disponível.

 

A organização esportiva pós-moderna tem Tecnologia da Informação estratégica e um corpo de cientistas de dados apoiando diretamente a tomada de decisão de seus líderes — seja o responsável maior da organização, como o presidente de um clube, seja os diretores dos departamentos. A TI meio, aquela que cuida da infraestrutura, torna-se o braço operacional. Na pós-modernidade, onde a tomada de decisão dos gestores esportivos não se fará sem o apoio de soluções tecnológicas, a TI pensa.

 

É uma mudança cultural, o maior desafio que as pessoas que estão à frente das organizações esportivas precisam enfrentar. Ventos inspiradores chegam da Bundesliga e da liga profissional norte-americana de basquete, a NBA, onde a TI já é estratégica, decide-se com base nos dados produzidos por equipes de cientistas e tanto a alta gestão quanto o marketing e a equipe técnica funcionam embasados por informação de qualidade.

Ex-aluno do DI compartilha sua experiência como curriculum developer

Ex-aluno do DI Pablo Musa trabalha como curriculum developer na empresa Elastic. Foto: Arquivo Pessoal

Pablo Musa falou sobre sua trajetória profissional e a importância do treinamento para capacitar os usuários de softwares

Com o surgimento de novos softwares, vem crescendo a demanda por profissionais que capacitem os usuários a explorar suas funcionalidades da maneira mais eficiente. Este é o papel dos curriculum developers, que criam conteúdo educativo (currículo) para ensinar o software e treinar os usuários.

 

Para falar sobre o tema, a professora Noemi Rodriguez entrevistou o ex-aluno Pablo Musa, um dos principais desenvolvedores de currículo na multinacional Elastic, em Amsterdã. A conversa, na quinta-feira (10), faz parte da série de lives promovidas pela graduação do DI e foi transmitida pelo Facebook e YouTube

Musa realiza treinamentos para usuários do principal software da empresa, o Elasticsearch, que proporciona soluções em busca, observabilidade e segurança. “A observabilidade estuda log de aplicações, métricas de servidores e application performance monitoring, que monitora a performance de uma aplicação, como o que está consumindo mais recursos ou gerando erros. E ao coletarmos essas informações, precisamos de segurança para garantir que ninguém está acessando os arquivos de maneira maliciosa”, explicou o ex-aluno do DI.

Segundo ele, o desenvolvimento do currículo parte de algumas perguntas. “Qual o espaço vazio que precisamos preencher? O que as pessoas querem aprender? Quando identificamos o que falta em termos de oferta de capacitação, a gente define os fluxos do treinamento”, afirmou.

Na criação de conteúdo para os treinamentos, é importante equilibrar textos, vídeos e interatividade, além de pensar histórias que sejam atrativas para o usuário. Outra preocupação é o data setting, ou seja, os dados que serão incluídos no treinamento. Depois da parte conceitual, os alunos passam ao ambiente de laboratório, onde se aproximam da prática. “Nesse sentido, é parecido com uma aula montada para um semestre da graduação ou da pós, por exemplo, mas em uma escala mais específica e voltada para uma ferramenta só”, comparou.

 

Professora Noemi Rodriguez entrevistou Pablo Musa durante live do DI. Foto: Reprodução/YouTube

Musa contou que já tinha envolvimento com a área de ensino quando foi aluno da PUC-Rio, onde atuou como monitor já no segundo período da graduação. “Sempre tive uma paixão muito grande por essa parte da educação, e quando entrei na PUC-Rio tive uma série de estímulos ao longo do caminho. Quando fui para o mestrado, comecei a dar aula para a graduação, o que definitivamente me preparou para minha trajetória. Ter podido investir nessa paixão desde o início e ter tido professores incríveis foi decisivo”, compartilhou Pablo, que fez Engenharia de Computação e Mestrado em Informática.

 

Para quem quer se desenvolver na área, o curriculum developer ressalta a importância de investir em um conhecimento profundo e conceitual de diferentes áreas da computação, para construir uma base forte e capacitada. “A estrutura de dados é uma parte fundamental. A partir dali, você pode criar qualquer coisa”, destacou.

Se você quer ficar por dentro das oportunidades do mercado de trabalho para profissionais da computação, não deixe de assistir as lives da graduação do DI que acontecem duas vezes por mês no Facebook e YouTube do departamento.

Algoritmo criado por aluno do DI em uso no Globoplay é destaque na RecSys

Pesquisa de doutorando Felipe Ferreira foi recebida na conferência e aplicada na indústria em poucos meses

Ainda há quem pense que pesquisa acadêmica e carreira no mercado de trabalho são inconciliáveis. Muito conectado com a indústria e a aplicação, o Departamento de Informática (DI) da PUC-Rio mostra que essa parceria é benéfica para os dois lados. O trabalho do doutorando Felipe Ferreira, orientado pelo professor Hélio Lopes, demonstra que as duas frentes devem atuar juntas em busca de soluções para problemas da vida real.

Formado em Ciência da Computação, Felipe trabalha como pesquisador em machine learning no time de recomendação do Grupo Globo, atualmente  dedicado ao Globoplay (plataforma de streaming). “O foco é otimizar a distribuição desse acervo para os usuários, principalmente visando maximizar suas experiências e expectativas em relação ao conteúdo”, disse. 

Nesse sentido, ele buscou soluções na literatura da pesquisa de doutorado, unindo forças com colegas de trabalho, para explorar as múltiplas características do conteúdo e chegar a um algoritmo de recomendação que impressionou a comunidade – e já está em uso no Globoplay.  “Temos uma escassez de metadados de vídeo e identificamos também que nossos algoritmos de recomendação baseados em conteúdo, especificamente de vídeo, não tinham um bom desempenho. Então, isso nos motivou a buscar alternativas, relacionadas à pesquisa, para que pudéssemos atacar esse problema”, afirmou. 

Segundo Felipe, o objetivo da pesquisa é trazer luz para um problema clássico na literatura de recomendação, chamado “cold start” ou “partida fria”. Diz respeito tanto ao usuário que acaba de assinar o produto – e por isso não se tem informação sobre ele – quanto ao ítem, ou seja, o vídeo publicado recentemente, cujo conteúdo ainda é desconhecido. Explorando as múltiplas modalidades do conteúdo, fica mais fácil recomendar, captar informações e descobrir a preferência do usuário e as nuances de suas mudanças de preferência. 

“Ali dentro tem atores, o mood; tem uma característica visual e um padrão sonoro que se trouxermos para nossos algoritmos teremos uma nova oportunidade de visualização”, ressaltou o pesquisador. Sob a orientação de Hélio e com os coautores do artigo, em alguns meses gerou a primeira interação. Trata-se ainda de uma versão inicial das recomendações, mas já validada por um teste AB e estudo qualitativo com um grupo de usuários. 

O resultado foi além das expectativas. “Elevamos nossas métricas de negócio com esse primeiro resultado preliminar, foi muito impressionante. Comprovamos com o teste AB que o algoritmo trouxe um lift positivo na taxa de clique, no engajamento do usuário e no clique seguido de play”, afirmou Ferreira.

O destaque na RecSys2020

A partir dos excelentes resultados alcançados, Felipe e os coautores do projeto — Daniele Souza, Igor Moura e Matheus Barbieri — o inscreveram na ACM (Association for Computing Machinery) Recommender Systems Conference, a “RecSys”. Uma vitrine das últimas tendências de pesquisa na área, o evento é muito conceituado e teria o Rio de Janeiro como sede pela primeira vez, não fosse a pandemia.

A RecSys aconteceu em formato remoto de 22 a 26 de setembro. A pesquisa de Felipe foi aceita e apresentada duas vezes. “Levamos este trabalho, ainda em fase inicial, e nossa técnica foi considerada uma abordagem nova para ser referência nas novas frentes de pesquisa em recomendação”, disse Felipe. 

Ele se surpreendeu com a curiosidade gerada pelo trabalho na comunidade. “Houve muitas perguntas após nossas apresentações. Perguntaram até quão melhor esse nosso algoritmo é em relação ao do YouTube, por exemplo. Nem chegamos ainda a comparar com esses outros. Foram vários questionamentos e elogios, fiquei muito motivado”, completou. 

Já está disponível no Globoplay

A pesquisa qualitativa foi feita por uma parceria da equipe de AI (inteligência artificial) e de recomendação — em que o Felipe trabalha —, com o time de usabilidade da empresa, na área de pesquisa em UX (experiência do usuário) da Globoplay. Assim que teve acesso aos resultados, a empresa colocou a aplicação em uso.

“Existe uma aba de similares, de onde extraímos e trazemos essa recomendação, baseada nessas múltiplas modalidades. Já está funcionando no Globoplay desde julho. Agora queremos evoluir para cada vez mais causar impacto maior e expandir para outras áreas do produto”, afirmou o doutorando. 

Para Hélio Lopes, orientador do trabalho, a troca de experiências entre a Academia e a Indústria é fundamental para levar o valor da pesquisa para o negócio. “Felipe é um excelente exemplo de motivação de aluno que vem para a academia aprimorar seus conhecimentos e trazer o retorno imediato para o trabalho na empresa. É uma história que vem se repetindo, passa por gerações. Sempre chegam novas pessoas motivadas por problemas reais”, disse.

Data Science: ‘É importante saber falar a língua dos dados’, diz Hélio Lopes, em live

Cientista de dados deve ser criativo, ter mente aberta e analítica, interesse humano e saber negociar

Para atingir a transformação digital, é importantíssimo uma mudança cultural. Foi com esse conceito que o professor Hélio Lopes, do Departamento de Informática (DI) da PUC-Rio, começou sua fala no seminário “Pesquisa em Ciência de Dados: A Escalada para a Valorização dos Dados”, transmitido ao vivo pelo Youtube na última sexta-feira (11). Com mais de 100 participantes conectados simultaneamente, o evento marcou a estreia da série de lives do DI como um sucesso e segue disponível online.

“As empresas estão todas interessadas em transformação digital. Ainda mais agora, neste período de pandemia, em que se verificou que automatizar processos, melhorar a comunicação de uma forma digital entre as pessoas com o uso de tecnologia é algo muito importante”, disse Hélio, ao apresentar o tema. Ele ressaltou “falar a língua dos dados” é hoje, para muitas profissões e setores da indústria, uma habilidade tão necessária quanto foi o domínio da língua inglesa no século passado.

Com o objetivo de transformar dados em informação e esta, por sua vez, em conhecimento, a Data Science — que foi traduzida para o português como “ciência de dados”, mas segundo o professor melhor seria ser chamada de “ciência por dados” — tem múltiplas aplicações. Com diferentes fundamentos e técnicas, abarca desde aplicativos como Waze até um sistema de busca semântica em cenas de novela através de reconhecimento facial. 

“Você cria uma ontologia, um sistema de acesso à base de dados, de forma eficiente. Mas para isso tem que ter um algoritmo que consiga realmente reconstruir sem erro dentro desse contexto o reconhecimento de cada artista em cada cena de todas as novelas do legado que existe na Globo, por exemplo”, disse Hélio. Esse projeto, “Globo Face Stream: A System for Video Meta-data Generation in an Entertainment Industry Setting”, foi desenvolvido pelo DI da PUC-Rio com alunos que atuam na Globo.com e recebeu o prêmio “Best Paper Award Certificate” neste ano.

Habilidades do Cientista de Dados

Lopes disse que, no Departamento de Informática da PUC, “ao formar esses novos cientistas de dados, queremos formar um líder em ciência de dados”. E elencou as habilidades necessárias para esse ideal de profissional, que precisa: 

  • Ter mente aberta
  • Ser criativo
  • Ter interesse humano
  • Ter poder analítico
  • Capacidade de fazer negócios

A combinação desses fatores em um cientista de dados atende ao maior interesse da indústria, que é melhorar seus negócios com o uso de dados para auxiliar as tomadas de decisão, segundo o professor. 

Dando sequência à série de lives do DI, que vai até dezembro, na próxima sexta (18), às 15h, o professor Edward Hermann falará sobre “Compressão de provas lógicas e a conjectura NP=PSPACE”, no YouTube do DI PUC Rio. Não perca!