Fechar

Por Dentro do DI: BioBD une biologia computacional a bancos de dados

Coordenador Sérgio Lifschitz com alunos e ex-alunos do BioBD no Simpósio Brasileiro de Bancos de Dados de 2018. Foto: Arquivo Pessoal

Laboratório realiza parcerias com instituições, como Fiocruz, Inca, UFRJ e UNB, para ajudar no desenvolvimento de pesquisas

 

Em tempos de pandemia da Covid-19, as pesquisas na área das ciências biológicas vêm ganhando destaque e gerando conhecimentos fundamentais para a sociedade. Já parou para pensar em como a computação pode contribuir para esses resultados? 

 

O Laboratório de Bioinformática e Bancos de Dados (BioBD), do Departamento de Informática (DI) da PUC-Rio, conduz pesquisas que unem biologia computacional e bancos de dados para desenvolver ferramentas que ajudem os cientistas. O BioBD realiza parcerias com pesquisadores e laboratórios de instituições e universidades, como Fiocruz, INCA, UFRJ, UERJ e UnB.

 

“Nossa contribuição permite que os cientistas desenvolvam produtos e pesquisas que vão ter efeitos diretos e extremamente relevantes à população, como no tratamento de doenças. Com a nossa colaboração, através de conhecimentos em modelagem e técnicas computacionais, é possível gerar resultados com eficiência e reprodutibilidade”, destaca o coordenador do Núcleo de Inovação Tecnológica, professor Sérgio Lifschitz.

 

O trabalho do BioBD envolve ainda questões centrais de pesquisa de banco de dados, particularmente sistemas de banco de dados autônomos, autogerenciados e autoajustáveis. 

 

As pesquisas do laboratório começaram em 1996, inicialmente abrigadas no LabPar (Laboratório de Paralelismo). No ano 2000, foi criado o LabBio, dando foco à bioinformática, até finalmente chegar, em 2006, ao nome atual, que enfatiza a ação nas duas áreas de pesquisa e desenvolvimento.

 

Grandes parcerias

As pesquisas científicas realizadas em laboratórios de biologia molecular ou bioquímica, conhecidos como wet labs, têm custo elevado, em geral, porque demandam produtos e reagentes que encarecem o processo. A bioinformática é uma solução para otimizar e viabilizar as pesquisas, acelerando seus resultados e reduzindo seus custos financeiros. Nos dry labs, onde se realizam análises matemáticas computacionais ou aplicadas, simulações permitem descartar a necessidade de várias etapas que seriam custosas pelo método tradicional, sem o apoio do computador.

 

“À medida que a bioinformática evoluiu, muita coisa começou a ser simulada em laboratório. Então, era mais barato simular a pesquisa computacionalmente do que gastar dinheiro com experimentos nos wet labs”, explica o professor, que é especialista em bancos de dados aplicados à bioinformática.

 

O coordenador conta que um problema comum a muitas instituições científicas é a dificuldade em gerenciar, organizar e visualizar grandes volumes de dados de maneira rápida e eficiente, mesmo com a disponibilidade de máquinas robustas e com maior poder computacional. O BioBD desenvolve soluções computacionais para este e outros problemas de banco de dados. 

Professor Sérgio Lifschitz. Foto: Divulgação

“Um aspecto importante do BioBD é que nos preocupamos em como as nossas contribuições do lado da computação podem ajudar em problemas reais enfrentados pelos biólogos. É uma parceria que acaba trazendo evoluções em ambas as áreas”, afirma o professor Lifschitz.

 

A primeira parceria foi com a Fundação Oswaldo Cruz, em 1994, no início do projeto Genoma, que permitiu a codificação da sequência completa de DNA dos seres humanos. Esta foi uma oportunidade de conduzir as teorias na área de banco de dados à aplicação prática nos laboratórios através de programas de algoritmos e soluções computacionais que simulam os fenômenos biológicos e bioquímicos. A cooperação entre os dois institutos segue ativa e foi formalizada neste ano. 

 

Inicialmente, a pesquisa era focada em genomas de espécies ligadas às doenças tropicais, como o Trypanosoma cruzi, mas vem se expandindo para novas áreas. “Hoje, estamos desenvolvendo um trabalho que chamamos de ‘bioinformática 2.0’ e uma modelagem formal alternativa para o dogma central da biologia”, informa Lifschitz. Os professores do DI Edward Hermann Haeusler e Luiz Fernando Bessa Seibel também participam da iniciativa.

 

O BioBD contribui ainda com o Instituto de Bioquímica Médica da UFRJ, especialmente em estudos do genoma e transcriptoma da cana-de-açúcar. Lifschitz ressalta que estes resultados são relevantes na agricultura e no mercado de combustíveis, gerando impactos para a economia brasileira.

 

Outros projetos

Além da bioinformática, o BioBD é direcionado a outras aplicações interdisciplinares da engenharia de dados. Diversos projetos já foram desenvolvidos, como o BioBD ENEM, que modela o banco de dados para processar estatísticas do Exame Nacional do Ensino Médio. 

 

As planilhas liberadas pelo INEP com as notas de todos os candidatos que fizeram o ENEM a cada ano são importadas para um banco de dados relacional, já que são volumosas e é quase inviável para um computador comum abri-las. A partir deste banco, são gerados múltiplos gráficos que são de interesse para coordenadores, professores e alunos envolvidos com o Exame Nacional do Ensino Médio.

 

Outro sistema desenvolvido pelo time do BioBD é o Busc@NIMA, que faz uma indexação de dados obtidos dos currículos Lattes de todos os professores da PUC e, através de uma plataforma web, permite aos usuários encontrar quem são os pesquisadores que tratam sobre determinados assuntos, facilitando a sinergia e colaborações futuras. 

 

O BioBD desenvolve ainda protótipos funcionais, já premiados no Simpósio Brasileiro de Bancos de Dados, como o sistema DBX e a ferramenta Outer-tuning, baseada em uma ontologia inovadora especializada em sintonia fina de bancos de dados relacionais.

 

Com a palavra, os alunos

Professor Sérgio Lifschitz ao lado das alunas Mariana Salgueiro (centro) e Andrea Mourelo (direita). Foto: Arquivo Pessoal

Os alunos que passaram pelo laboratório consideram a experiência enriquecedora e guardam com afeto as lembranças dos projetos e das equipes. É o que conta a ex-aluna espanhola Andrea Mourelo, que cursou um duplo diploma em parceria entre a PUC-Rio e a École Centrale Paris, na França.

 

“Foi uma experiência incrível! Aprendi muito sobre banco de dados, modelagem, desenvolvimento web, e também sobre a linguagem PHP. Sem dúvida, essa experiência fez a diferença e me ajudou a arrumar o meu emprego atual em Paris, além de me fazer crescer muito pessoalmente”, divide Andrea, que participou do projeto Busc@NIMA.

 

O laboratório também foi importante para o ex-aluno Eric Grinstein, que contribuiu com o BioBD ENEM: “Olhando para trás, vejo que aprendi muito no BioBD e tento levar em cada novo projeto a disciplina de modelar um problema antes de começar a resolvê-lo, o que sempre trás muitas vantagens”, afirma Grinstein. Eric já trabalhou como engenheiro de dados na Microsoft e como engenheiro de software na OLX, e hoje faz doutorado no Imperial College, em Londres.

 

A aluna de mestrado do DI Mariana Salgueiro, que colabora com o BioBD e é responsável pelo desenvolvimento do Busc@NIMA, reforça a importância do laboratório na formação dela. “Além do aprendizado que eu tive pra me tornar a profissional que eu sou hoje, foi no laboratório também que eu fiz vários amigos que vou levar pro resto da vida. O ambiente é muito amigável e muito propício para você aprender coisas novas ou colocar o que foi aprendido em prática. O professor Sérgio sempre traz novos projetos e novos desafios para os estagiários”.