Defesa de Dissertação de Doutorado do aluno Leonardo Cardia da Cruz
Título da dissertação: Habilitando Anotações de Dados Autônomos: Uma Abordagem de Aprendizado por Reforço com Humano no Loop
Resumo: As técnicas de aprendizado profundo têm mostrado contribuições significativas em vários campos, incluindo a análise de imagens. A grande maioria dos trabalhos em visão computacional concentra-se em propor e aplicar novos modelos e algoritmos de aprendizado de máquina. Para tarefas de aprendizado supervisionado, o desempenho dessas técnicas depende de uma grande quantidade de dados de treinamento, bem como de dados rotulados. No entanto, a rotulagem é um processo caro e demorado. Uma recente área de exploração são as reduções dos esforços na preparação de dados, deixando-os sem inconsistências, ruídos, para que os modelos atuais possam obter um maior desempenho. Esse novo campo de estudo é chamado de Data-Centric IA. Apresentamos uma nova abordagem baseada em Deep Reinforcement Learning (DRL), cujo trabalho é voltado para a preparação de um conjunto de dados onde as anotações de caixas delimitadoras são feitas de modo autônomo e econômico. Nossa abordagem consiste na criação de uma metodologia para treinamento de um agente virtual a fim de rotular automaticamente os dados, a partir do auxílio humano como professor desse agente. Implementamos o algoritmo Deep Q-Network para criar o agente virtual e desenvolvemos uma abordagem de aconselhamento para facilitar a comunicação do humano professor com o agente virtual estudante. Para completar nossa implementação, utilizamos o método de aprendizado ativo para selecionar casos onde o agente possui uma maior incerteza, necessitando da intervenção humana no processo de anotação durante o treinamento. Nossa abordagem foi avaliada e comparada com outros métodos de aprendizado por reforço e interação humano-computador, em diversos conjuntos de dados, onde o agente virtual precisou criar novas anotações na forma de caixas delimitadoras. Os resultados mostram que o emprego da nossa metodologia impacta positivamente para obtenção de novas anotações a partir de um conjunto de dados com rótulos escassos, superando métodos existentes. Desse modo, apresentamos a contribuição no campo de Data-Centric IA, com o desenvolvimento de uma metodologia de ensino para criação de uma abordagem autônoma com aconselhamentos humanos para criar anotações econômicas a partir de anotações escassas.
Orientador: Prof. Dr. Alberto Barbosa Raposo
Co-orientador: Prof. Dr. Cesar Augusto Sierra Franco
Banca:
Prof. Dr. Anselmo Cardoso de Paiva
Prof(a) Dr(a) Sandra Eliza Fontes de Avila
Prof. Dr. Marcelo Gattass
Prof. Dr. Jan Jose Hurtado Jauregui
Prof. Dr. Luiz José Schirmer Silva
Prof. Dr. Helio Côrtes Vieira Lopes
Acompanhe-nos também no site: https://puc-rio.zoom.us/j/99944871210?pwd=clk0QUtqM2lyNTFJZTFIYms1WUFTQT09
Did you know that PUC-Rio hosted the first computer installed in Brazil? Learn a bit more about our history:
The Burroughs Datatron B-205 arrived in Brazil by an effort of a consortium that included CNPq (Brazilian research funding agency), IPqM (Research Institute of the Brazilian Navy) and the foreign office Itamaraty, which brought it to PUC-Rio, chosen for its academic excellence. The computer was put in the Rio Data Centro (RDC) building. At the inauguration ceremony many important people of the time, such as president Juscelino Kubitschek, were present
A large room had to be used to house the computer, as it weighed approximately a ton and contained 1,600 double triode valves, a huge set of solid state diodes, resistors and capacitors that together consumed 30 kVA of power. To keep it running smoothly, a powerful air conditioning system had to be installed in the RDC building.
Other highlights of the large computer were the amount of memory that it had, 4 thousand words of 10 decimal digits, very much for that time, and the fast basic operations. For example, a simple sum, took 0.1 milliseconds, which was surprisingly fast for the time. Basic output, i.e. printing, could be done in two ways: a hammer typewriter or an IBM tabulating printer that printed 60 lines of 80 numeric characters per minute.
This first computer cost about one million dollars. Today, it is estimated that this would be equivalent to about US$10 million, which shows the importance of the equipment for the time. To use it, users had to make an appointment, sometimes days in advance, as the Burroughs B-205 was only capable of running one user job at a time.
It was from the prominence of PUC-Rio’s Rio Data Center (RDC), created to host and operate the Burroughs B-205 and later several other mainframes that followed it until the 1980s, that the Departamento de Informática (DI) was created in 1965, with the main objective to train people to program computers and start the development of the area of “Computer Science”. And from this uncertain and adventurous beginning, the first Brazilian graduate courses in computing emerged. As a side part, the creation and naming of the Department is said to have had a nice side-product: it coined the term Informatica, until then non-existent in the Portuguese language.
Você sabia que a PUC-Rio recebeu o primeiro computador instalado no Brasil? Conheça um pouco mais sobre a nossa história:
O Burroughs Datatron B-205 chegou ao Brasil por um consórcio formado pelo CNPq, IPqM (Marinha) e Itamaraty, que o trouxeram para a PUC, escolhida pela sua excelência. O computador foi abrigado no Centro de Processamento de Dados (CPD) – onde hoje está localizada a Empresa Júnior. A cerimônia de inauguração do espaço contou com nomes como o presidente Juscelino Kubitschek.
Foi preciso utilizar uma sala inteira para abrigá-lo, pois pesava um pouco mais de uma tonelada e continha 1.600 válvulas duplos triodos, um enorme conjunto de diodos estado sólido, resistências e capacitores que juntos consumiam 30 kVA de energia. Para manter o funcionamento correto, foi necessário instalar um sistema exclusivo de ar condicionado no CPD, algo raríssimo na época. Com tamanha inovação tecnológica em mãos, o interesse público rapidamente cresceu, levando diversos setores comerciais a buscarem aplicações práticas semelhantes. Um exemplo moderno desse fenômeno é o surgimento de plataformas como Kimi-Siegel’s neue Wettanbieter, que dependem justamente de sistemas robustos e estáveis para gerenciar milhares de apostas simultâneas sem interrupção.
Outros destaques do maquinário eram a quantidade de memória que, para a época, era surpreendente, 4 mil palavras de 10 dígitos decimais, e a velocidade das operações, uma adição, por exemplo, consumia 0,1 milissegundos. A impressão podia ser feita de duas formas: uma máquina de escrever de martelinhos ou uma impressora tabuladora IBM que imprimia 60 linhas de 80 caracteres numéricos por minuto.
O computador custava cerca de um milhão de dólares. Hoje, estima-se que isso equivaleria a aproximadamente US$ 10 milhões, o que demonstra a importância do equipamento para a época. Para utilizá-lo era preciso marcar hora, às vezes com dias de antecedência, pois o computador só era capaz de executar um job de usuário por vez.
Foi a partir do Rio Data Centro (RDC), criado para hospedar e operar, até os anos 80, o Burroughs B-205 e demais computadores mainframes que se seguiram a este, surgiu em 1965 o Departamento de Informática, com o principal objetivo de capacitar pessoas na programação de tais máquinas e inicial a área de “Ciência da Computação”. E a partir desse início incerto e aventureiro surgiram então os primeiros cursos de pós-graduação em computação. Como curiosidade adicional, a criação do Departamento também teve um efeito colateral interessante: cunhou o termo Informática, que até então existia na língua brasileira.
Autor: Pedro Ferreira Alves Pinto
Orientador: Sérgio Colcher
Data e Hora: 30/09/2022 às 10:00
Autor: Leonardo Cardia da Cruz
Orientador: Alberto Barbosa Raposo
Data e Hora: 30/09/2022 às 13:30
Defesa de Dissertação de Mestrado do aluno Felipe Poggi de A. Fraga
Título da dissertação: On Automatic Generation of Knowledge Connections
Resumo: Contexto: Recentemente, o tópico de Gestão de Conhecimento Pessoal vem ganhando muita popularidade, ilustrado pelo rápido crescimento de aplicativos como Notion, Obsidian, e Roam Research e da aparição de livros como ”How to Take Smart Notes” e ”Building a Second Brain”.Contudo, ainda é uma área que não foi fortemente envolvida pelo Processamento de Linguagem Natural, abrindo assim uma oportunidade para a aplicação do processamento de texto aplicado à operações com conhecimento.Objetivo: Nosso objetivo é o desenvolvimento de um sistema de software que utiliza Processamento de Linguagem Natural (NLP) para transformar uma coleção de textos isolados em uma coleção de textos inter-conectada e internavegável, através de mecanismos de navegação baseados em conceitos mencionados e recomendações semânticas.Trabalho: Neste trabalho apresentamos a metodologia para construir o sistema, demonstrações com exemplos palpáveis, assim como uma avaliação para determinar a coerência dos resultados.
Orientador: Prof. Dr. Marcus Vinicius Soledade Poggi de Aragao
Banca:
Prof. Dr. Marco Antonio Casanova
Prof(a) Dr(a) Simone Diniz Junqueira Barbosa
Prof. Dr. Helio Côrtes Vieira Lopes
Acompanhe-nos também pelo link: https://puc-rio.zoom.us/j/99231065632?pwd=T1lWTS9vWlVidUd4ZWp2citocTN5Zz09
Você quer estudar Computação no Departamento localizado no prédio Rio Data Centro, que abrigou o primeiro computador de grande porte a operar produtivamente no Brasil, o Burroughs B-205?
Então a hora é agora! Inscreva-se no vestibular 2023 da PUC-RIO. Temos uma série de bolsas, parciais e integrais, para os melhores colocados. Conheça o novo currículo:
A nova grade da Ciência da Computação, assim como todos os demais cursos do CTC, terão disciplinas de projetos práticos em todos os semestres, desde o início. Estas permitirão que os alunos apliquem os conhecimentos teóricos aprendidos em outras disciplinas do curso a problemas reais, trazidos por profissionais do mercado de várias empresas de TI parceiras. Além disso, serão ensinadas não só competência técnicas como também competências sociais (soft skills).
Ao contrário de outras graduações em Computação oferecidas por outras universidades, o curso de Ciência da Computação prima pela sua qualidade e profundidade. Trata-se de um curso generalista, em que o aluno primeiro aprende todos os principais conceitos, fundamentos, metodologias e princípios tecnológicos da Ciência da Computação e nos últimos semestres pode optar por inúmeras disciplinas optativas e linhas de especialização, como Ciência de Dados, IA, Games, Banco de Dados, Computação Gráfica etc. Além disso, o aluno que esteja interessado em posteriormente fazer um mestrado pode já cursar disciplinas da pós-graduação antecipadamente, e assim diminuir a duração do seu mestrado.
Nossos alunos egressos são considerados a “nata no mercado” de trabalho de TI brasileiro e internacional, são “caçados” por quase todas as grandes e mais conhecidas empresas nacionais, e muitos de nossos egressos são contratados por empresas mundo afora.
Não perca essa nova chance e se inscreva no vestibular 2023: https://www.puc-rio.br/vestibular/202212/
Quer conhecer mais sobre o curso? Assista ao vídeo: https://www.youtube.com/watch?v=h1959x254u8&list=PLRKeuVfLlY-7YyqBe4gdgciEifd0mTGls
Veja um depoimento de um dos nossos ex-alunos: https://www.youtube.com/watch?v=Ma8789JbTwg&list=PLRKeuVfLlY-6NSbMZHgkk8BNcWka9xrMe