Defesa de Tese de Doutorado do aluno Augusto Icaro Farias da Cunha.
Título da Tese: A Semi-Supervised Approach for Borehole Image Log Structures Segmentation for Small Labeled Datasets
Resumo: A crescente demanda por aplicações orientadas a dados criou uma vantagem competitiva crucial para as empresas que adotam essas abordagens. O desafio está em preparar e documentar dados que possam ser usados com eficiência em fluxos de trabalho de aprendizado de máquina. A ausência de dados rotulados de petróleo e gás publicamente disponíveis aumenta a dificuldade de aplicar essas técnicas a esse campo. Para resolver esse problema, apresentamos uma estratégia para reduzir o tempo de preparo dos dados de perfil de imagem acústico de poço para segmentação semântica em fluxos de trabalho de estimativa de permeabilidade. Nosso método utiliza uma estrutura de aprendizado semi-supervisionado em que uma pequena parte dos dados é inicialmente rotulada. O procedimento de pré-processamento termina dividindo os dados rotulados em patches de 256×256 para entrada de rede. Em seguida, empregamos a arquitetura DC-Unet para segmentação semântica binária. O pós-processamento melhora ainda mais a qualidade do contorno da estrutura, e o uso de pseudo-labels atentos à incerteza permite a rotulagem semiautomática de dados não rotulados por meio do fine-tuning da rede. Nossos resultados são altamente promissores baseados em um banco de dados privado de 32 perfis de imagem acústica de cinco bacias diferentes. Estabelecemos um fluxo de trabalho de estado da arte para segmentação semântica de estruturas de perfil imagem acústicos de poço, gerando uma pontuação F1 de 79,3% para breakouts. Qualitativamente, os intérpretes profissionais atestaram que a rede foi capaz de detectar e segmentar com precisão breakouts, distingui-los de outras cavidades e detectar estruturas mal rotuladas no conjunto de dados de teste. Também propomos uma técnica de preenchimento de flood fill local restrito para melhorar ainda mais a saída da rede com base na similaridade de amplitude. Com esses avanços, nossa solução oferece um meio eficiente e de baixo custo de preparar dados da empresa para fluxos de trabalho de aprendizado de máquina.
Orientador: Prof. Dr. Marcelo Gattass
Banca: Prof. Dr. Helio Côrtes Vieira Lopes | Prof. Dr. Cristina Nader Vasconcelos | Prof. Dr. Rodrigo Surmas | Prof. Dr. Jan Jose Hurtado Jauregui |
Assista a defesa pelo link: https://puc-rio.zoom.us/j/97044561817?pwd=RUs2MEk2VEtRT0JWT2M1Z1JiM0NXUT09