Defesa de Tese de Doutorado - Jéssica Soares dos Santos
22/03/2023, 15:00h, por videoconferência. Link para defesa: https://meet.google.com/uif-tbsg-wwn
Mining Opinions in the Electoral Domain Based on Transfer Learning Approaches
Resumo:
Pesquisas eleitorais tradicionais envolvem a realização periódica de entrevistas com pessoas de diferentes regiões geográficas, demandando tempo, recursos financeiros, e esforços humanos. A disponibilidade de uma enorme quantidade de opiniões na Web surgiu como uma alternativa às pesquisas eleitorais tradicionais, devido ao fato de que esse tipo de dado pode ser coletado automaticamente de forma mais rápida e barata. Nesta tese, propomos um método que pode ser útil para analisar as opiniões dos eleitores com base na análise de sentimentos de dados do Twitter. Para lidar com a falta de dados rotulados nesse domínio, utilizamos técnicas de aprendizado por transferência (transfer learning) e aproveitamos o conhecimento prévio obtido com datasets rotulados que podem pertencer a outros domínios e idiomas. Um método de recomendação de datasets é apresentado para lidar com este problema. Os resultados de nossos experimentos sugerem que a análise da (dis)similaridade entre datasets pode ser útil para escolher o conjunto de dados mais apropriado para transferir conhecimento e obter melhores previsões de sentimentos em cenários eleitorais. Outra contribuição deste trabalho é a disponibilização de um dataset eleitoral coletado do Twitter manualmente rotulado de acordo com diferentes dimensões: análise de sentimentos, presença discurso ofensivo, e posicionamento a favor ou contra os candidatos, considerando dados do Twitter sobre as eleições presidenciais brasileiras de 2018. O método para recomendação de datasets e o dataset eleitoral fornecido podem ser adotados para auxiliar na condução de análises de eleições futuras.
Abstract:
Traditional election polls are based on conducting interviews periodically with people from different geographical regions, requiring time, financial resources and human efforts. The availability of a huge amount of data in the Web containing opinions from potential electors has arisen as an alternative to traditional polls, due to the fact that this kind of data can be gathered automatically in a faster and cheaper way. In this thesis, we are concerned with proposing a method that can be useful to analyze electorate opinions based on Twitter data and sentiment analysis methods. In order to deal with the lack of labeled data in this scenario, we use transfer learning techniques and take advantage of prior knowledge achieved with other datasets that may belong to other domains or languages. A dataset recommendation strategy is presented to tackle this problem. Our experimental results suggest that analyzing the (dis)similarity between different datasets may be useful to choose the most proper dataset for transfer learning and achieve better sentiment predictions in electoral scenarios. Another contribution of this work is to provide an electoral dataset manually labeled according to different dimensions: sentiment analysis, offensive speech presence, and candidate support, considering Twitter data related to the 2018 brazilian presidential election. The dataset recommendation method and the electoral dataset provided by this research may be adopted to aid the analysis of future election forecasts.
Banca examinadora:
Prof. Flavia Cristina Bernardini, UFF – Presidente
Prof. Aline Marins Paes Carvalho, UFF
Prof. Alexandre Plastino de Carvalho, UFF
Prof. José Viterbo Filho, UFF
Prof. Solange Oliveira Rezende, USP
Prof. Edimara Mezzomo Luciano, PUCRS
Pós-Graduação
PESQUISA PELO SITE |
MENU
|
CONTATO![]() Av. Gal. Milton Tavares de Souza, s/nº |
|||||||||
CONECTE-SE![]() ![]() |
LINKS
|