Como pesquisas em bancos de dados podem ajudar no tratamento do câncer?

Coordenador do BioBD, professor Sérgio Lifschitz falou sobre pesquisas com bancos de dados| Foto: Reprodução

Em live, professor Sérgio Lifschitz falou sobre projetos em parceria com o INCA voltados à descoberta de variantes e fármacos

São múltiplas as possibilidades de aplicação das pesquisas em bancos de dados. Na última sexta-feira (25), o professor do DI Sérgio Lifschitz falou sobre projetos desenvolvidos pelo Laboratório de Bioinformática e Bancos de Dados (BioBD) em parceria com o Instituto Nacional do Câncer (INCA). A apresentação foi na live da pós-graduação transmitida pelo Facebook e YouTube do DI.

Lifschitz, que coordena o BioBD, contou que estão em andamento duas pesquisas voltadas à implantação de um sistema de workflow científico, em particular para a bioinformática, com aplicações diferentes.

Uma delas busca dar apoio à descoberta de variantes do genoma e tratamentos do câncer através da identificação de diferenças entre o genoma de um indivíduo ou grupo de indivíduos alvos em comparação com um genoma de referência. Os dados são coletados de pacientes reais, sendo resguardada sua privacidade.

“Propomos colaborar trazendo o processo de abstração da computação, colocando isso no sistema e permitindo manutenção, com um olhar de reprodutibilidade e performance”, afirmou Lifschitz. “Esse resultado é interessante porque pode ser oferecido a médicos e pesquisadores do próprio INCA para serem usados para estudos e tratamentos direcionados”, completou.

Uma segunda pesquisa se debruça sobre a identificação de potenciais terapêuticos em câncer colorretal. Lifschitz destacou que um desafio no desenvolvimento de fármacos está no reconhecimento de potenciais genes, já que existem aproximadamente 100 mil genes humanos. É necessário, portanto, filtrar as opções disponíveis.

Durante a apresentação, o professor falou ainda sobre uma outra pesquisa que está em desenvolvimento em parceria com a Fundação Oswaldo Cruz (Fiocruz): o projeto Gene e Bioinformática 2.0, que propõe uma releitura do dogma central da biologia a partir de uma nova modelagem.

“Existem interpretações diferentes de grupos da biologia e da bioinformática sobre o que é um gene. Um dos nossos objetivos é dar uma visão integrada sobre o assunto, tentando cobrir as diferentes visões que existem das diversas pesquisas”, explicou.

Este foi o último seminário da pós-graduação do DI neste semestre. Para ficar por dentro das próximas novidades, inscreva-se no nosso canal do YouTube (youtube.com/dipucrio) e fique atento às nossas redes sociais!

Live aborda desafios em bancos de dados para a bioinformática

Coordenador do BioBD, professor Sérgio Lifschitz, vai falar sobre trabalhos e parcerias que vêm sendo realizados na área

Não faltam oportunidades para quem deseja aplicar seus conhecimentos em computação à área de ciências da vida. Na live da pós-graduação do Departamento de Informática (DI) desta sexta-feira (25), às 15h, no Facebook e YouTube do DI, o professor Sérgio Lifschitz vai discutir como a computação pode colaborar para uma pesquisa interdisciplinar e falar sobre a importância dessa participação para viabilizar trabalhos científicos.

Lifschitz é coordenador do Laboratório de Bioinformática e Bancos de Dados (BioBD), que desenvolve pesquisas envolvendo grandes volumes de data e realiza parcerias com instituições de excelência como Fiocruz e INCA. O professor explica que os bancos de dados têm inúmeras aplicações possíveis. Uma delas é a bioinformática, uma solução para otimizar pesquisas, acelerando seus resultados e reduzindo seus custos financeiros.

No seminário, Lifschitz vai falar sobre colaborações que vêm sendo conduzidas pelo BioBD, como o projeto de uma nova modelagem que permite uma releitura do dogma central da biologia. Também será apresentado o trabalho com sistemas de gerência de workflow científico na aplicação de tratamentos de câncer.

Venha assistir e participar do seminário, mande dúvidas e comentários! E inscreva-se no nosso canal do YouTube (youtube.com/dipucrio) para não ficar de fora das novidades!

Por Dentro do DI: BioBD une biologia computacional a bancos de dados

Coordenador Sérgio Lifschitz com alunos e ex-alunos do BioBD no Simpósio Brasileiro de Bancos de Dados de 2018. Foto: Arquivo Pessoal

Laboratório realiza parcerias com instituições, como Fiocruz, Inca, UFRJ e UNB, para ajudar no desenvolvimento de pesquisas

Em tempos de pandemia da Covid-19, as pesquisas na área das ciências biológicas vêm ganhando destaque e gerando conhecimentos fundamentais para a sociedade. Já parou para pensar em como a computação pode contribuir para esses resultados?

O Laboratório de Bioinformática e Bancos de Dados (BioBD), do Departamento de Informática (DI) da PUC-Rio, conduz pesquisas que unem biologia computacional e bancos de dados para desenvolver ferramentas que ajudem os cientistas. O BioBD realiza parcerias com pesquisadores e laboratórios de instituições e universidades, como Fiocruz, INCA, UFRJ, UERJ e UnB.

“Nossa contribuição permite que os cientistas desenvolvam produtos e pesquisas que vão ter efeitos diretos e extremamente relevantes à população, como no tratamento de doenças. Com a nossa colaboração, através de conhecimentos em modelagem e técnicas computacionais, é possível gerar resultados com eficiência e reprodutibilidade”, destaca o coordenador do Núcleo de Inovação Tecnológica, professor Sérgio Lifschitz.

O trabalho do BioBD envolve ainda questões centrais de pesquisa de banco de dados, particularmente sistemas de banco de dados autônomos, autogerenciados e autoajustáveis.

As pesquisas do laboratório começaram em 1996, inicialmente abrigadas no LabPar (Laboratório de Paralelismo). No ano 2000, foi criado o LabBio, dando foco à bioinformática, até finalmente chegar, em 2006, ao nome atual, que enfatiza a ação nas duas áreas de pesquisa e desenvolvimento.

Grandes parcerias

As pesquisas científicas realizadas em laboratórios de biologia molecular ou bioquímica, conhecidos como wet labs, têm custo elevado, em geral, porque demandam produtos e reagentes que encarecem o processo. A bioinformática é uma solução para otimizar e viabilizar as pesquisas, acelerando seus resultados e reduzindo seus custos financeiros. Nos dry labs, onde se realizam análises matemáticas computacionais ou aplicadas, simulações permitem descartar a necessidade de várias etapas que seriam custosas pelo método tradicional, sem o apoio do computador.

“À medida que a bioinformática evoluiu, muita coisa começou a ser simulada em laboratório. Então, era mais barato simular a pesquisa computacionalmente do que gastar dinheiro com experimentos nos wet labs”, explica o professor, que é especialista em bancos de dados aplicados à bioinformática.

O coordenador conta que um problema comum a muitas instituições científicas é a dificuldade em gerenciar, organizar e visualizar grandes volumes de dados de maneira rápida e eficiente, mesmo com a disponibilidade de máquinas robustas e com maior poder computacional. O BioBD desenvolve soluções computacionais para este e outros problemas de banco de dados.

Professor Sérgio Lifschitz. Foto: Divulgação

“Um aspecto importante do BioBD é que nos preocupamos em como as nossas contribuições do lado da computação podem ajudar em problemas reais enfrentados pelos biólogos. É uma parceria que acaba trazendo evoluções em ambas as áreas”, afirma o professor Lifschitz.

A primeira parceria foi com a Fundação Oswaldo Cruz, em 1994, no início do projeto Genoma, que permitiu a codificação da sequência completa de DNA dos seres humanos. Esta foi uma oportunidade de conduzir as teorias na área de banco de dados à aplicação prática nos laboratórios através de programas de algoritmos e soluções computacionais que simulam os fenômenos biológicos e bioquímicos. A cooperação entre os dois institutos segue ativa e foi formalizada neste ano.

Inicialmente, a pesquisa era focada em genomas de espécies ligadas às doenças tropicais, como o Trypanosoma cruzi, mas vem se expandindo para novas áreas. “Hoje, estamos desenvolvendo um trabalho que chamamos de ‘bioinformática 2.0’ e uma modelagem formal alternativa para o dogma central da biologia”, informa Lifschitz. Os professores do DI Edward Hermann Haeusler e Luiz Fernando Bessa Seibel também participam da iniciativa.

O BioBD contribui ainda com o Instituto de Bioquímica Médica da UFRJ, especialmente em estudos do genoma e transcriptoma da cana-de-açúcar. Lifschitz ressalta que estes resultados são relevantes na agricultura e no mercado de combustíveis, gerando impactos para a economia brasileira.

Outros projetos

Além da bioinformática, o BioBD é direcionado a outras aplicações interdisciplinares da engenharia de dados. Diversos projetos já foram desenvolvidos, como o BioBD ENEM, que modela o banco de dados para processar estatísticas do Exame Nacional do Ensino Médio.

As planilhas liberadas pelo INEP com as notas de todos os candidatos que fizeram o ENEM a cada ano são importadas para um banco de dados relacional, já que são volumosas e é quase inviável para um computador comum abri-las. A partir deste banco, são gerados múltiplos gráficos que são de interesse para coordenadores, professores e alunos envolvidos com o Exame Nacional do Ensino Médio.

Outro sistema desenvolvido pelo time do BioBD é o Busc@NIMA, que faz uma indexação de dados obtidos dos currículos Lattes de todos os professores da PUC e, através de uma plataforma web, permite aos usuários encontrar quem são os pesquisadores que tratam sobre determinados assuntos, facilitando a sinergia e colaborações futuras.

O BioBD desenvolve ainda protótipos funcionais, já premiados no Simpósio Brasileiro de Bancos de Dados, como o sistema DBX e a ferramenta Outer-tuning, baseada em uma ontologia inovadora especializada em sintonia fina de bancos de dados relacionais.

Com a palavra, os alunos

Professor Sérgio Lifschitz ao lado das alunas Mariana Salgueiro (centro) e Andrea Mourelo (direita). Foto: Arquivo Pessoal

Os alunos que passaram pelo laboratório consideram a experiência enriquecedora e guardam com afeto as lembranças dos projetos e das equipes. É o que conta a ex-aluna espanhola Andrea Mourelo, que cursou um duplo diploma em parceria entre a PUC-Rio e a École Centrale Paris, na França.

“Foi uma experiência incrível! Aprendi muito sobre banco de dados, modelagem, desenvolvimento web, e também sobre a linguagem PHP. Sem dúvida, essa experiência fez a diferença e me ajudou a arrumar o meu emprego atual em Paris, além de me fazer crescer muito pessoalmente”, divide Andrea, que participou do projeto Busc@NIMA.

O laboratório também foi importante para o ex-aluno Eric Grinstein, que contribuiu com o BioBD ENEM: “Olhando para trás, vejo que aprendi muito no BioBD e tento levar em cada novo projeto a disciplina de modelar um problema antes de começar a resolvê-lo, o que sempre trás muitas vantagens”, afirma Grinstein. Eric já trabalhou como engenheiro de dados na Microsoft e como engenheiro de software na OLX, e hoje faz doutorado no Imperial College, em Londres.

A aluna de mestrado do DI Mariana Salgueiro, que colabora com o BioBD e é responsável pelo desenvolvimento do Busc@NIMA, reforça a importância do laboratório na formação dela. “Além do aprendizado que eu tive pra me tornar a profissional que eu sou hoje, foi no laboratório também que eu fiz vários amigos que vou levar pro resto da vida. O ambiente é muito amigável e muito propício para você aprender coisas novas ou colocar o que foi aprendido em prática. O professor Sérgio sempre traz novos projetos e novos desafios para os estagiários”.

Artigo de Lifschitz e Hermann será publicado na BMC Bioinformatics

Selecionado como best paper na CMLS 2020, trabalho traz uma proposta de solução para problema relevante da bioinformática

A parceria entre pesquisadores das áreas de computação e biologia resultou num artigo premiado internacionalmente que será publicado na revista BMC Bioinformatics. Escrito pelos professores do Departamento de Informática (DI) da PUC-Rio Sérgio Lifschitz e Edward Hermann, pelo ex-aluno de doutorado Cristian Tristão e pelo pesquisador da Fiocruz Antonio Basílio de Miranda, o artigo “Relational Text-type for Biological Sequences” foi escolhido como best paper em um dos workshops da 39ª Conferência Internacional de Modelagem Conceitual (ER 2020). Lifschitz apresentou o trabalho no 1º Workshop Internacional em Modelagem Conceitual para Ciências da Vida (CMLS, na sigla em inglês) que fez parte da conferência.

“É uma revista super top na área e vão fazer uma edição com os melhores artigos selecionados. O best paper certamente entrou e ficou isento da taxa de publicação, então foi um prêmio duplo”, comemora Lifschitz. “Ter o nosso trabalho reconhecido e valorizado pelos nossos pares é sempre um enorme motivo de alegria e realização, pois nos incentiva a prosseguir, buscando novos limites”, acrescenta Miranda.

Segundo Lifschitz, a revista vai publicar a versão estendida do artigo contendo contribuições inéditas, inclusive os resultados práticos de um trabalho que ele já vem desenvolvendo com outros dois alunos da graduação do DI a partir do resultado alcançado na tese de doutorado de Cristian Tristão.

O projeto consiste utilizar um tipo de dados presentes em Sistemas Gerenciadores de Bancos de Dados (SGBD) relacionais para armazenar sequências de aminoácidos que tentam representar matematicamente o DNA de uma espécie. Por serem sequências muito grandes, o processamento raramente é feito com a sequência inteira. Em geral, os biólogos guardam essas informações em arquivos-texto, porém, como o conjunto de dados é muito grande, gera um problema de representação destas very large sequences (sequências muito grandes). Como não há muitas soluções prontas para o armazenamento destas sequências biológicas em bancos de dados, Tristão propôs em sua tese o armazenamento em banco de dados relacional, usando o tipo text, que permite armazenar a quantidade de dados das sequências biológicas sem preocupação com o tamanho.

“O Antonio (Fiocruz) trouxe o problema para a gente, foi nos dizendo quais as funções eram necessárias e nós fomos pensando como desenvolver essas funções específicas para lidar com textos nesta área particular da ciência, que é a bioinformática. O Hermann ajudou a orientar na formalização e deu muitas sugestões na defesa de tese do Cristian. Cabe ressaltar que além de armazenar, desenvolvemos um conjunto de soluções com funções que o biólogo precisa, voltada para aquele domínio de aplicação. Isso acabou se mostrando um sucesso”, conta Lifschitz.

A pesquisa segue com outros dois alunos Sergio Gustavo M. P. Moreira e Alexandre Wanick Vieira, sob orientação de Lifschitz. Eles trabalham na reimplementação de funções antigas, desenvolvimento de novas funções e uma interface tipo web para os usuários. “Esses alunos estão desenvolvendo a ferramenta e colocando o código público no GitHub, para quem quiser baixar e usar”, afirma o orientador.

Continue reading →