Defesa de Dissertação de Mestrado de João Pedro de Matos d’Assumpção, 20/03/26, 10h, por videoconferência

Defesa de Dissertação de Mestrado de João Pedro de Matos d’Assumpção, 20/03/26, 10h, por videoconferência

 

Link para defesa: meet.google.com/ksr-xqet-tov


Biased Bootstrap for Positive and Unlabeled Learning

Resumo:

 

Este trabalho propõe um novo método de Positive and Unlabeled (PU) learning, um tipo de tarefa de classificação no qual as instâncias são positivas ou não rotuladas. Devido à ausência de instâncias negativas, a maioria dos métodos de PU-learning foca na identificação de instâncias não rotuladas que podem ser usadas como negativas para, em seguida, treinar um modelo de classificação binária supervisionado usando instâncias positivas e as instâncias negativas previamente inferidas. Neste contexto, este trabalho propõe um método denominado Biased Bootstrap for PU-learning (BBPU), um ensemble contendo um procedimento de bootstrap enviesado para realizar a amostragem das instâncias utilizadas no aprendizado de cada modelo base. O método BBPU essencialmente realiza duas etapas: primeiramente, estima a probabilidade de cada instância não rotulada ser negativa e, em seguida, realiza um novo tipo de bootstrap enviesado, projetado para PU-learning, no qual a probabilidade de uma instância não rotulada ser escolhida na amostragem é proporcional à sua probabilidade estimada de ser da classe negativa. Dois experimentos foram conduzidos: primeiro, uma comparação com três métodos relevantes e representativos de PU-learning, avaliados em 20 bases de dados de benchmark; segundo, uma aplicação do BBPU na identificação de genes humanos relacionados ao envelhecimento – um problema aberto de PU-learning – e a comparação de seus resultados com um estudo prévio. Os resultados do primeiro experimento demonstraram que o BBPU possui melhor desempenho em relação aos três outros métodos de PU-learning, com significância estatística na maioria dos casos. O segundo experimento mostrou a capacidade do BBPU de contribuir com problemas abertos relevantes no campo de aplicações de PU-learning.

 

Abstract:

 

This work proposes a new method for Positive and Unlabeled (PU) learning, a type of classification task in which instances are either labeled as positive or unlabeled. Due to the lack of negative instances, most PU-learning methods focus on inferring which unlabeled instances can be used as negatives to then train a standard binary classification model using the positive and inferred negative instances. In this context, this work proposes a method called Biased Bootstrap for PU-learning (BBPU), an ensemble that applies a biased bootstrap procedure for sampling the instances used for learning each base classification model in the ensemble. BBPU essentially performs two key steps: first, it estimates the probability that each unlabeled instance is negative; then, it performs a new type of biased bootstrap sampling, tailored for PU-learning, in which the probability of an unlabeled instance being sampled and used as negative is proportional to its estimated negative-class probability. Two experiments were performed: first, a comparison with three relevant and representative PU-learning procedures, evaluated on 20 benchmark datasets; second, an application of the BBPU to the identification of human ageing-related genes – an open PU-learning problem – and the comparison of the results with a previous study. The results of the first experiment showed that BBPU outperformed all three other PU learning methods, with statistical significance in most cases. The second experiment showed BBPU’s ability to contribute to relevant open problems in the field of PU-learning.

 

Banca  examinadora:

 

Prof. Alexandre Plastino de Carvalho, UFF

Profa. Flavia Cristina Bernardini, UFF

Dr. Marcelo Rodrigues de Holanda Maia, IBGE

Prof. Ricardo Cerri, USP

Related Posts

Leave a Reply