
Defesa de Dissertação de Mestrado de Alecy Aparecida Araujo Praes, em 27/06/2024, às 10:30 horas, por videoconferência
Link para defesa: https://meet.google.com/kco-borc-wsz
Gerenciamento de Data Lakes através do Uso de Mineração de Relações entre Entidades em Textos Usando BERT
Resumo:
A Extração de Relacionamento de Entidades (ERE) é uma tarefa crucial no Processamento de Linguagem Natural que envolve a identificação de entidades e suas conexões no texto. ERE pode ser útil em vários campos, como no aprimoramento de mecanismos de pesquisa, na estruturação de dados em data lakes e na construção de gráficos de conhecimento. Esta dissertação apresenta um método ERE utilizando Processamento de Linguagem Natural, através do BERT transformando sentenças em vetores e da árvore de dependências para classificar as conexões dentre um conjunto de conexões pré definidas. O método proposto é comparado a uma abordagem baseada em GPT e posteriormente o resultado da ERE é inserido em um RDF e usado para fazer pesquisas dentro do data lake.
Abstract:
Entity Relationship Extraction (ERE) is a crucial task in Natural Language Processing that involves identifying entities and their connections in text. ERE can be helpful in various fields, such as enhancing search engines, structuring data in data lakes, and constructing knowledge graphs. This dissertation introduces an ERE method using Natural Language Processing, using BERT to transform the sentences into vectors and the dependency tree to classify the connections. The proposed method is compared to a GPT-based approach.
Banca examinadora:
Prof. Luiz André Portes Paes Leme, UFF – Presidente
Prof. Daniel Cardoso Moraes de Oliveira, UFF
Profa. Vanessa Braganholo Murta, UFF
Prof. Marco Antonio Casanova, PUC-Rio