
Defesa de Tese de Doutorado de Matheus Moreira Cruz, 14/10/25, 18h, por videoconferência
Link para defesa: https://meet.google.com/hjc-wgai-zig
Exploring Machine Learning and General-purpose Generative AI Techniques for Merge Conflict Resolution
Resumo:
A resolução manual de conflitos de merge é um gargalo persistente no desenvolvimento colaborativo de software, reconhecida como uma tarefa demorada e sujeita a erros. Embora a comunidade de pesquisa tenha proposto diversas abordagens automatizadas, de técnicas determinísticas a modelos especializados de aprendizado de máquina, persiste uma lacuna entre suas capacidades e a diversidade de desafios enfrentados pelos desenvolvedores. Esta tese avança o estado da arte ao investigar a aplicação de dois paradigmas complementares de inteligência artificial para esse problema: uma abordagem preditiva baseada em aprendizado de máquina supervisionado e uma abordagem generativa baseada em Modelos de Linguagem de Grande Porte (LLMs) de propósito geral.
Primeiramente, apresentamos o MESTRE, um classificador projetado para auxiliar desenvolvedores ao prever a estratégia ótima de resolução para um conflito. Os resultados mostram que um modelo preditivo pode oferecer orientação valiosa e automatizar uma parcela significativa dos conflitos de resolução direta.
Em seguida, conduzimos um estudo empírico sistemático sobre o uso de um LLM de propósito geral para gerar resoluções de conflitos. Os achados indicam desempenho competitivo em relação a modelos especializados, com destaque para a síntese de mudanças e o reconhecimento de padrões de refatoração, ainda que persistam desafios em tarefas que exigem compreensão semântica mais profunda.
Ao explorar sistematicamente esses dois paradigmas, a tese fornece uma análise detalhada das forças e limitações da IA preditiva e da IA generativa na resolução de conflitos de merge. As conclusões abrem espaço para abordagens híbridas, lançando as bases para ferramentas futuras que integrem orientação preditiva com síntese generativa como contribuição original para a área.
Abstract:
The manual resolution of merge conflicts is a persistent bottleneck in collaborative software development, recognized as a time-consuming and error-prone task. While the research community has proposed various automated approaches, ranging from deterministic techniques to specialized machine learning models, a significant gap remains between their capabilities and the diverse challenges developers face. This thesis advances the state of the art by exploring the application of two complementary artificial intelligence paradigms to this problem: a predictive approach based on supervised machine learning and a generative approach based on general-purpose Large Language Models (LLMs).
First, we present MESTRE, a machine learning classifier designed to assist developers by predicting the optimal resolution strategy for a given conflict. Our results show that a predictive model can provide valuable guidance and automate a large share of straightforward conflicts.
Second, we conduct a systematic empirical study on the use of an off-the-shelf, general-purpose LLM to directly generate conflict resolutions. The findings indicate that LLMs can achieve competitive performance compared to specialized, fine-tuned models, excelling in synthesizing changes and recognizing refactoring patterns, while still facing challenges with tasks requiring deeper semantic understanding.
By systematically exploring these two paradigms, this thesis provides a detailed analysis of the respective strengths and limitations of predictive and generative AI for merge conflict resolution. The combined findings open space for hybrid approaches, laying the foundation for future tools that integrate predictive guidance with generative synthesis as an original contribution to the field.
Banca examinadora:
Prof. Leonardo Gresta Paulino Murta, UFF – Presidente
Profa. Aline Marins Paes Carvalho, UFF
Profa. Vânia de Oliveira Neves, UFF
Prof. Eduardo Soares Ogasawara, CEFET/RJ
Prof. Márcio de Oliveira Barros, UNIRIO
Prof. Igor Scaliante Wiese, UTFPR