Defesa de Dissertação de Mestrado de João Victor Passeri Medeiros Amorim – 13/12/2024, 14h, por videoconferência
Link para defesa: https://meet.google.com/eba-pqgi-wcu
Previsão de Resultados de Partidas de Futebol Usando Redes Neurais de Grafos Heterogêneos
Resumo:
Esta dissertação propõe uma modelagem para dados históricos de futebol utilizando grafos heterogêneos, que representam as interações entre jogadores e a dinâmica das partidas. Diferente dos modelos tradicionais, que dependem de engenharia de atributos e de suposições sobre distribuições probabilísticas, este trabalho utiliza a propriedade de invariância a permutações dos grafos para considerar as escalações iniciais das equipes. Redes neurais de grafos (GNNs) foram empregadas para aprender automaticamente as representações latentes de times e jogadores, em uma tentativa de capturar a complexidade do esporte. O modelagem do grafo desenvolvida não exige uma posição fixa de entrada para os jogadores, garantindo flexibilidade e consistência. Ele também leva em conta o nível técnico dos jogadores titulares, ajustando as previsões de acordo com a escalação inicial, identificando quando as equipes utilizam jogadores reservas e adaptando os resultados com base nessas escolhas. Foram realizadas análises nas dez das principais ligas de futebol no mundo, comparando o desempenho da proposta com modelos tradicionais de engenharia de características. Os resultados indicam que o modelo proposto atingiu um desempenho semelhante aos modelos baseline, que utilizam a construção de características como Elo-rating e Pi-rating, e, em alguns casos, superou o desempenho das casas de apostas. O modelo apresentado permite uma representação mais precisa das equipes e contribui com a previsão de resultados de partidas de futebol, sem a necessidade de engenharia manual de atributos.
Abstract:
This dissertation proposes a model for historical football data using heterogeneous graphs, which represent player interactions and match dynamics. Unlike traditional models that rely on feature engineering and assumptions about probabilistic distributions, this work leverages the permutation invariance property of graphs to account for teams’ starting lineups. Graph neural networks (GNNs) were employed to automatically learn latent representations of teams and players in an effort to capture the sport’s complexity. The developed graph model does not require a fixed input position for players, ensuring flexibility and consistency. It also considers the skill level of starting players, adjusting predictions according to the initial lineup, identifying when teams use substitute players, and adapting outcomes based on these choices. Analyses were conducted on ten of the world’s major football leagues, comparing the performance of the proposed model with traditional feature-engineering models. The results indicate that the proposed model achieved performance comparable to baseline models, which utilize feature constructions such as Elo-rating and Pi-rating, and, in some cases, even outperformed betting houses. This model enables a more accurate representation of teams and contributes to predicting football match outcomes without the need for manual feature engineering.
Banca examinadora:
Profa. Aline Marins Paes Carvalho, UFF – Presidente
Profa. Isabel Cristina Mello Rosseti, UFF
Prof. Leandro Santiago de Araújo, UFF
Prof. Ricardo Marcondes Marcacini, USP