Alunos da Especialização em Ciência de Dados têm artigos aceitos no SBSI

Da esquerda para a direita: Ney Barchilon, José Douglas Nascimento e Márcio Afonso. Foto: Arquivo pessoal

Curso lato sensu do DI se destaca por promover produção científica em suas turmas

Na pós-graduação stricto sensu – ou seja, no mestrado e no doutorado em Informática do Departamento de Informática (DI) da PUC-Rio, faz parte da formação dos alunos atuar em pesquisas de ponta e relatar os resultados em artigos científicos. Apesar desse tipo de produção não ser comum em cursos lato sensu, o DI incentiva a produção científica também de seus alunos de especialização, o que trouxe notícias muito positivas: três artigos da turma de 2019 da Especialização em Ciência de Dados foram aceitos para publicação no Simpósio Brasileiro de Sistemas de Informação (SBSI). Detalhe: nenhum dos alunos havia submetido um artigo científico antes. 

Os trabalhos “Machine Learning Aplicado ao Resultado de Pedido de Concessão de Benefícios do INSS”, de Ney Barchilon; “Construção de Tábuas de Mortalidade com a utilização de Redes Neurais LSTM”, de José Douglas Nascimento; e “Clusters of Brazilian municipalities and the relationship with their fiscal management”, de Márcio Afonso, serão apresentados na conferência em junho, que será online por conta da pandemia de Covid-19.

A coordenadora da especialização e orientadora dos trabalhos, Tatiana Escovedo, destacou a taxa de aceitação rigorosa do SBSI. “As conferências mais prestigiadas têm uma seletiva taxa de aceitação. Esta edição do SBSI, por exemplo, teve em torno de 30%”, disse. No total, foram 179 artigos submetidos e 59 aceitos. Dentre os aceitos, três são dos nossos alunos da pós lato sensu em Ciência de Dados. 

Orgulhosa, Tatiana espera que o fato inspire não só as atuais turmas de 2020 e 2021, mas também os futuros alunos do curso. “Participar de produções científicas pode estimular e abrir oportunidade para que os alunos ingressem no mestrado e no doutorado”, contou a professora, também destacando um potencial da pesquisa lato sensu. “Como muitos alunos atuam no mercado, é possível haver uma colaboração forte entre indústria e academia.”

Conheça os trabalhos

O artigo “Machine Learning Aplicado ao Resultado de Pedido de Concessão de Benefícios do INSS”, de Ney Barchilon, propõe um modelo de machine learning para agilizar os processos de concessão de benefícios no INSS. Segundo Barchilon, essa aplicação ajudaria a prever se determinado pedido seria concedido ou não, possibilitando a redução do tempo de espera. “Eu percebi que podia montar um algoritmo para fazer essa previsão a partir dos dados abertos do INSS, disponíveis no site do Governo Federal”, disse. 

Já o trabalho “Construção de Tábuas de Mortalidade com a utilização de Redes Neurais LSTM”, de José Douglas Nascimento, consiste em um modelo específico de machine learning (no caso, as aplicações de redes neurais LSTM) para estimar a taxa de mortalidade da população brasileira nos próximos 10 anos, de forma que os estados possam mensurar riscos na área de previdência e de seguros. Essa técnica poderia facilitar o atual formato calculado e divulgado pelo IBGE. 

Por fim, o artigo “Clusters of Brazilian municipalities and the relationship with their fiscal management”, de Márcio Afonso, analisa os municípios brasileiros e suas características socioeconômicas para propor um modelo estatístico capaz de agrupá-los em diferentes combinações, percebendo se existem influências sobre como as prefeituras estão gerindo os recursos públicos. 

Essa foi a primeira vez em que os três autores submeteram artigos científicos para publicação, e o sentimento de orgulho foi grande para todos. Tanto Barchilon, formado em Estatística, quanto Márcio Afonso, economista de formação, acharam que não teriam chances. “Ter sido aprovado na minha primeira tentativa foi bastante surpreendente e positivo”, disse Afonso. 

José Douglas Nascimento, que é atuário, também se surpreendeu com a experiência. “Escrever um artigo foi um grande alcance, valeu por tudo que eu fiz”, disse emocionado. Durante o curso, Nascimento contraiu Covid-19, foi internado na UTI e, mesmo assim, acompanhou as aulas por se identificar com o que estava aprendendo. “A pós foi muito importante para eu receber a denominação de cientista de dados. Não era só uma realização profissional, eu também precisava desse ganho na minha vida”, contou. 

Mais sobre a pós em Ciência de Dados

A pós-graduação lato sensu em Ciência de Dados do DI inclui possui uma ementa abrangente e diferenciada, fornecendo a formação ideal para um cientista de dados. São abordados tópicos como Machine Learning, Inteligência Artificial, Banco de Dados, Big Data, Cloud Computing, LGPD e Gestão de Dados. 

A próxima turma iniciará em Março de 2022 e, assim como as turmas atuais, adotará o formato online. Para Barchilon, Afonso e Nascimento, o curso fez toda a diferença em suas carreiras. Eles elogiaram o corpo docente, a ementa proposta e as aplicações teóricas e práticas ao longo das aulas. 

De acordo com Tatiana, os próximos passos são estreitar laços entre a pós-graduação lato sensu e a stricto sensu da PUC-Rio. “Planejamos envolver professores do mestrado e doutorado na produção destes artigos, promovendo um intercâmbio de experiências com os pesquisadores de referência nessas áreas”, contou.

Por Dentro do DI: Daslab desenvolve e inova na área de Ciência de Dados

O professor Hélio Lopes (esq.) recebendo, pelo daslab, o prêmio do BPI Challenge 2017, em Barcelona. Foto: Arquivo pessoal

Laboratório realiza pesquisas na área de data science e desenvolve produtos para a indústria

No terceiro post da série “Por Dentro do DI”, falaremos sobre o daslab, que é o Núcleo de Inovação Tecnológica (NIT) em Ciência de Dados do Departamento de Informática da PUC-Rio. Ele é co-coordenado pelos professores Hélio Lopes e Simone D. J. Barbosa.

O objetivo do daslab é fazer pesquisa, desenvolvimento e inovação em Ciência de Dados, incluindo as suas áreas afins, como: aprendizado de máquina, mineração de dados, mineração de processos, visualização, UX / UI, inteligência artificial, bancos de dados, IoT e ética na computação.

“O nosso foco é desenvolver métodos e sistemas computacionais que resolvam os problemas da vida real”, disse Lopes, que criou o laboratório em 2017 a fim de proporcionar um espaço ao desenvolvimento de pesquisas na área de ciência de dados.

Ainda de acordo com o co-coordenador, o daslab realiza não só pesquisas práticas e teóricas na área de data science, mas também desenvolve produtos para a indústria. “Em dado produto para um cliente, nós trabalhamos a interpretação de relatórios operacionais, tentando extrair as informações que vinham desses textos, a fim de possibilitar buscas semânticas em linguagem natural”, exemplificou. 

Interdisciplinaridade

Um dos pontos altos do daslab é a sua forte colaboração com outros NITs do Departamento de Informática, principalmente com IDEIAS-SERG, Galgos e ExACTa. De acordo com Lopes, a área de ciência de dados é bastante interdisciplinar e conversa com as propostas dos demais NITs. 

Integrantes do daslab. Foto: Arquivo pessoal

O IDEIAS-SERG realiza pesquisa multidisciplinar em IHC e UX, focando atualmente em Engenharia Semiótica e Semiótica Computacional; Visualização de Informação e Visual Analytics; Computação Centrada em Humanos; e Ética e Mediação Algorítmica de Processos Sociais. Esse laboratório traz para o daslab seu conhecimento e experiência em análise, design e avaliação de interação e de interfaces de usuário (IHC+UX).

Já o Galgos visa desenvolver e aplicar métodos algorítmicos para o manuseio e a análise de grandes volumes de dados, e otimizar recursos de médio e grande porte. Nesse caso, o daslab colabora na parte de interpretar relatórios analíticos. 

Por fim, o ExACTa usufrui o trabalho do daslab e dos demais NITs para entregar produtos para transformação digital da indústria de uma forma ágil.

A união dos NITs resulta em uma equipe com cerca de 40 membros, entre alunos de graduação, mestrado, doutorado e participantes dos projetos, que transitam entre os diferentes trabalhos dos laboratórios. 

“A gente puxa para o lado da cooperação, estabelecendo uma troca entre os alunos e participantes, enriquecendo o trabalho e fazendo com que todos ganhem muito com isso”, explicou Lopes. “O daslab oferece uma enorme experiência para os alunos, em termos de conhecimento e prática com aplicações na indústria.”

Conquistas 

O laboratório tem executado importantes projetos com a indústria, tem promovido a difusão de conceitos de data science em diversos setores e tem sido reconhecido por seu trabalho.

No final de 2017, o daslab conquistou o BPI Challenge 2017, premiação voltada à área de mineração de processos. “Resolvemos um desafio mundial e obtivemos a conquista”, contou Lopes, que participou do evento em Barcelona, na Espanha. 

Já em 2020, o laboratório recebeu o prêmio de Melhor Artigo na International Conference on Enterprise Information Systems (ICEIS), com o artigo “Globo Face Stream: A System for Video Meta-data Generation in an Entertainment Industry Setting”, escrito por Lopes e pelos alunos de doutorado Rafael Pena, Felipe A. Ferreira, Frederico Caroli e Luiz Schirmer. 

Gostou da iniciativa e deseja fazer parte? Fique de olho, porque o daslab está disposto a receber alunos de graduação, mestrado e doutorado interessados em trabalhar com a área de ciência de dados – uma das mais requisitadas do mercado. Basta entrar em contato com os professores Hélio Lopes (lopes@inf.puc-rio.br) ou Simone Barbosa (simone@inf.puc-rio.br). 

Curso de Ciência de Dados, área com ampla procura, abre turmas online

O início das aulas está previsto para o dia 9 de março, com duração de 18 meses

A especialização em Ciência de Dados do Departamento de Informática (DI) da PUC-Rio está com as inscrições abertas. O início das aulas está previsto para o dia 9 de março e o curso terá duração de 18 meses. Neste ano, a especialização será 100% on-line, possibilitando o ingresso de graduados de qualquer parte do Brasil e do mundo.

Para este formato, as aulas acontecerão de forma síncrona, ou seja, em horário marcado e em tempo real. Além disso, todo o conteúdo será também gravado e disponibilizado para os alunos que não tiverem a oportunidade de acompanhar alguma das aulas síncronas e interativas.

Ementa inclui conceitos teóricos e práticos da área

O curso trata de tópicos variados para fornecer a formação ideal para um cientista de dados, como: Machine Learning, Inteligência Artificial, Banco de Dados (Bancos de dados relacionais, NoSQL, Data Warehouses, Data Lake, etc), Big Data, Cloud Computing, LGPD e Gestão de Dados, Visualização da Informação, Dashboards, entre outros.

Com nove disciplinas e um trabalho final, o objetivo da especialização é formar profissionais que sejam capazes de analisar dados, aplicar as suas respectivas técnicas em organizações e acompanhar as tendências do mercado.

De acordo com a professora de especialização da PUC-Rio e coordenadora do curso, Tatiana Escovedo, o conhecimento em Ciência de Dados deve ir além do uso de ferramentas e tecnologias. “Buscamos assegurar que os alunos entendam o processo de ciência de dados, ou seja, que eles sejam capazes de entender todo o caminho, desde a necessidade do cliente até a entrega de soluções que agreguem valor ao negócio”, disse. 

O curso é voltado para pessoas graduadas em qualquer área e que tenham familiaridade com a área de exatas. “Ciência de dados é um tema quente em computação e áreas correlatas, que tem diversas aplicações nas mais distintas áreas, como Saúde, Óleo e Gás, Engenharia de Produção, Vendas, Recursos Humanos, Direito, Letras, Economia, entre muitas outras”, complementa Tatiana. 

O professor do DI e também coordenador do curso, Hélio Cortes Vieira Lopes, ressalta a importância da familiaridade e do domínio em Ciência de Dados para o mercado de trabalho. “A área veio para dar valor aos dados nos mais diferentes ramos de atuação da indústria. No século XXI, profissionais das mais diferentes áreas terão como requisito ter conhecimento nessa área”, afirmou.

A primeira versão da especialização de Ciência de Dados foi criada na década de 2000 pelo então professor associado do DI e também coordenador Rubens Nascimento Melo. 

“Na ocasião, o curso já enfatizava os principais tópicos de BI (Business Intelligence) e era focado em data warehousing, data mining e gestão do conhecimento. Agora, adaptamos o curso de forma que ele tenha novos seminários e outros tópicos, refletindo a modernidade da área”, disse Melo.

Como se inscrever? 

As inscrições para a especialização Ciência de Dados estão abertas e podem ser realizadas via CCE. O curso começa em 9 de março. Os encontros síncronos serão realizados às segundas, terças e quartas-feiras, de 19h às 22h, pela plataforma Zoom.

A página do CCE da PUC-Rio reúne todas as informações sobre a ementa, valores e inscrições. Para acessá-la, basta clicar aqui.

Endler mostra como Internet das Coisas pode ajudar no combate à Covid-19

Em live, Diretor do DI apresentou kit de sensores e mobile hub para monitoramento de pacientes 

A Internet das Coisas tem múltiplas aplicações e uma delas pode ser a serviço da saúde. Pesquisador de IoMT (Internet of Mobile Things) Markus Endler, diretor do Departamento de Informática (DI) da PUC-Rio, mostrou na live do DI, na sexta-feira (16), projetos de software e hardware que podem ajudar no combate à Covid-19 monitorando os sinais vitais dos pacientes. “Cada vez mais temos dispositivos wearable (usáveis) muito bons, muito precisos, onde se pode medir, por exemplo, a insulina, o pulso, o oxímetro… o que é muito importante na pandemia”, disse. 

No seminário “Middleware para Internet das Coisas com Mobilidade”, transmitido pelo YouTube e pelo Facebook, Endler detalhou o que é IoT e suas aplicações. Apresentou exemplos de sistemas de IoT em larga escala e abordou a questão da mobilidade. O professor também descreveu em linhas gerais o ContextNet, o middleware desenvolvido integralmente no LAC (Laboratory of Advanced Colaboration) da PUC-Rio há oito anos. “Ele é escalável, tem um protocolo de comunicação confiável e leve, permite estar conectado com até 1000 IoT simultaneamente, e está disponível para uso em pesquisa ou de ensino também”, disse o professor, sobre as vantagens do ContextNet.

Dentre as suas áreas de aplicação, cidades inteligentes, IoT na indústria, healthcare (saúde) e monitoramento ambiental, a tecnologia pode se tornar uma ferramenta de combate ao novo coronavírus, se usada para monitorar os pacientes. Endler mostrou como funciona um componente de software para um sistema de monitoramento de pacientes com sintomas leves da Covid-19, desenvolvido no semestre passado. “Observamos que os profissionais da saúde, com tantos pacientes, têm dificuldade de perceber rapidamente a piora do estado de saúde de um paciente. E em algumas doenças infecciosas, como na Covid-19, essa piora pode ser muito rápida. Então a ideia é ter o hardware como um wearable, — que você coloca ou no dedo ou na orelha — e coleta a frequência cardíaca, a saturação de oxigênio e a temperatura. Em seguida, envia isso para o sistema de monitoramento e de alarme que vai então mandar os alarmes para os enfermeiros e médicos”, explicou o professor.  

 

LEIA TAMBÉM:

Endler: ‘No futuro, as coisas vão se interconectar automaticamente’

Capes apoia projeto de professor do DI sobre combate à Covid-19

Jogo criado por alunos do DI e do DAD brilham na cena internacional de games

 

Endler apresentou a interface mobile do sistema, que mostra inclusive um gráfico com a evolução dos sintomas ao longo do tempo. “Ainda não está implantado, mas a parte de software está praticamente toda pronta”, afirmou. Além do  , também é necessário um kit de sensores. “É ergonômico, leve, pequeno. E o envio de dados é ajustável. Tem a vantagem da economia da bateria. E esse kit seria de baixo custo, entre R$ 100 e R$ 400, muito abaixo do valor dos equipamentos que se usa em uma UTI”, apontou. 

A live com o professor Endler está disponível no nosso canal do YouTube. Se inscreva e não perca os próximos seminários.

Endler: ‘No futuro, as coisas vão se interconectar automaticamente’

Diretor do DI apresentará seminário online sobre a Internet das Coisas nesta sexta (16)

Já pensou na tranquilidade de ter uma janela que se fecha automaticamente quando começa a chover? E se todos os aparelhos da sua casa fossem interconectados e funcionassem sozinhos, a ponto de você não precisar interagir com cada um? Pois essa tecnologia tem tudo a ver com o seminário “Middleware para Internet das Coisas com Mobilidade”, do diretor do Departamento de Informática (DI) da PUC-Rio, Markus Endler, nesta sexta-feira (16). “A internet das coisas (IoT) é a ideia de que, no futuro, as coisas vão se interconectar automaticamente, adaptando-se às necessidades do usuário sem que ele tenha que configurar nada”, adianta Endler.

Embora a área de aplicação de IoT (Internet of Things) que mais avançou em popularização e produtos seja a de smart home (casa inteligente), atualmente a internet das coisas está presente em muitas áreas, como na agricultura, nas cidades inteligentes e na indústria 4.0 — já é bastante eletrônica, mas que ainda não tem comunicação entre as máquinas. É justamente aí que entra a IoT. “Na minha pesquisa, em particular, me interesso pela internet das coisas móveis. Acredito que cada vez mais vamos carregar muitos aparelhos conosco. Podemos imaginar que no futuro teremos sensores em ônibus, por exemplo”, diz.

Endler destaca como exemplo uma rede de drones que se coordena no vôo para otimizar o percorrimento de uma área e coletar dados. “Ao voar juntos, já vão coletando dados através de sensores e repassando a informação de um para o outro, de tal maneira que rapidamente você tem acesso a esses dados pela internet”, explica. “A internet das coisas é a infraestrutura necessária para coletar dados que posteriormente serão analisados. Não se pode pensar em ciência de dados sem pensar na infraestrutura para coletá-los de forma confiável. Se não há garantia da confiabilidade e consistência dos dados, eles não valem de nada. E, para isso, um software de IoT é fundamental.”

Endler ressalta que apesar de muito se falar das aplicações, o foco da pesquisa é desenvolver uma camada de middleware mais genérica e independente. Assim, a depender de onde será usada, pode ser configurada com os serviços e módulos necessários para a aplicação em questão. “Podemos compor o software de acordo com a necessidade. Isso proporciona economia de energia, porque é um software mais enxuto, não é tão grande”, diz. Segundo o pesquisador, o middleware tem funções para descobertas de objetos móveis e para estabelecer conexão com eles, além de uma opção para difundir os dados que coleta de forma organizada.

Para saber mais detalhes, não perca o seminário na sexta-feira (16), às 15h. Se inscreva no canal do DI no Youtube e ative o lembrete. Assim você recebe um aviso antes do início da live e, além de assistir, poderá tirar suas dúvidas pelo chat ao vivo!

Continue reading

‘Web-of-Data é uma outra web por trás da web’, afirma Casanova, em live

Em seminário online, professor fez um convite para a disciplina sobre Integração de Dados que vai ministrar no DI da PUC-Rio

“No início, isso tudo aqui era mato”. Essa frase recorrentemente é usada nas redes socias para falar sobre o início da internet. E foi esse “mato” o ponto de partida do professor Marco Antonio Casanova no seminário “Selected Topics on the Web-of-Data and Data Integration”, transmitido ao vivo no canal do YouTube e na página do Facebook do Departamento de Informática (DI) da PUC-Rio, na sexta-feira (25). “A história da web começou há 41 anos. Desde o instante zero, tudo na web é baseado em padrões, e isso é extremamente importante”, disse.

 Na primeira parte da palestra, Casanova falou sobre a história de Web-of-Data, dando ênfase na ideia de que se pode taguear as páginas da web com RDF (Resource Description Framework), que é apropriado para isso. “Na verdade, Web-of-Data é uma outra web por trás da web que a gente está acostumada a ver, e que descreve dados”, afirmou o professor, que também deu exemplos de keyword search para mostrar como começar a trabalhar com RDF diretamente.

Casanova também abordou a integração de dados e apontou os problemas relacionados. “O problema de integração de dados está no cerne da Ciência de Dados”, alertou.  Ele falou sobre questões como schema alignment, criação de ontologia de domínio, extração de dados e datafusion, entre outras. Antes de encerrar e abrir para perguntas, o professor fez um convite para todos participarem de seu curso de Integração de Dados no próximo semestre, e brincou: “A boa notícia é que vocês não vão ter que me escutar, quem dá as aulas são os próprios alunos, eu simplesmente tento organizar um pouco o material”.

Essa foi a terceira edição da série de lives do DI. Na estreia, o professor Hélio Lopes falou sobre Ciência de Dados, ressaltando a importância de se falar a língua dos dados atualmente. No dia 18, Edward Hermann apresentou sua pesquisa, que impressionou o mundo da computação, e contou que foi preciso aliar as ciências exatas e humanas para resolver um problema que estava há mais de 40 anos em aberto na computação. Não perca as próximas lives: se inscreva no canal do DI e ative o lembrete!

 

Data Science: ‘É importante saber falar a língua dos dados’, diz Hélio Lopes, em live

Cientista de dados deve ser criativo, ter mente aberta e analítica, interesse humano e saber negociar

Para atingir a transformação digital, é importantíssimo uma mudança cultural. Foi com esse conceito que o professor Hélio Lopes, do Departamento de Informática (DI) da PUC-Rio, começou sua fala no seminário “Pesquisa em Ciência de Dados: A Escalada para a Valorização dos Dados”, transmitido ao vivo pelo Youtube na última sexta-feira (11). Com mais de 100 participantes conectados simultaneamente, o evento marcou a estreia da série de lives do DI como um sucesso e segue disponível online.

“As empresas estão todas interessadas em transformação digital. Ainda mais agora, neste período de pandemia, em que se verificou que automatizar processos, melhorar a comunicação de uma forma digital entre as pessoas com o uso de tecnologia é algo muito importante”, disse Hélio, ao apresentar o tema. Ele ressaltou “falar a língua dos dados” é hoje, para muitas profissões e setores da indústria, uma habilidade tão necessária quanto foi o domínio da língua inglesa no século passado.

Com o objetivo de transformar dados em informação e esta, por sua vez, em conhecimento, a Data Science — que foi traduzida para o português como “ciência de dados”, mas segundo o professor melhor seria ser chamada de “ciência por dados” — tem múltiplas aplicações. Com diferentes fundamentos e técnicas, abarca desde aplicativos como Waze até um sistema de busca semântica em cenas de novela através de reconhecimento facial. 

“Você cria uma ontologia, um sistema de acesso à base de dados, de forma eficiente. Mas para isso tem que ter um algoritmo que consiga realmente reconstruir sem erro dentro desse contexto o reconhecimento de cada artista em cada cena de todas as novelas do legado que existe na Globo, por exemplo”, disse Hélio. Esse projeto, “Globo Face Stream: A System for Video Meta-data Generation in an Entertainment Industry Setting”, foi desenvolvido pelo DI da PUC-Rio com alunos que atuam na Globo.com e recebeu o prêmio “Best Paper Award Certificate” neste ano.

Habilidades do Cientista de Dados

Lopes disse que, no Departamento de Informática da PUC, “ao formar esses novos cientistas de dados, queremos formar um líder em ciência de dados”. E elencou as habilidades necessárias para esse ideal de profissional, que precisa: 

  • Ter mente aberta
  • Ser criativo
  • Ter interesse humano
  • Ter poder analítico
  • Capacidade de fazer negócios

A combinação desses fatores em um cientista de dados atende ao maior interesse da indústria, que é melhorar seus negócios com o uso de dados para auxiliar as tomadas de decisão, segundo o professor. 

Dando sequência à série de lives do DI, que vai até dezembro, na próxima sexta (18), às 15h, o professor Edward Hermann falará sobre “Compressão de provas lógicas e a conjectura NP=PSPACE”, no YouTube do DI PUC Rio. Não perca!