Defesa de Dissertação de Mestrado de André Fernandes Gonçalves – 21/03/2025, 10h, por videoconferência

Defesa de Dissertação de Mestrado de André Fernandes Gonçalves – 21/03/2025, 10h, por videoconferência

 

Link para defesa: https://meet.google.com/giy-tkez-ftz

 

Classificação de Alagamento em Vias com Tráfego na Cidade do Rio de Janeiro através de Visão Computacional

Resumo:

 

Este trabalho teve como objetivo desenvolver uma abordagem inicial para a classificação automática de alagamentos da cidade do Rio de Janeiro. Para isso, este trabalho primeiramente criou um conjunto de dados original composto de 4620 imagens separadas em 78% para treino e 22% para validação. Este conjunto de dados foi montado com imagens de câmeras de ruas da cidade do Rio ao longo de diferentes meses, em diferentes horas do dia e em diferentes níveis de alagamento. Após o conjunto de dados ser devidamente analisado e montado de forma equilibrada, cinco arquiteturas de redes neurais foram avaliadas nesse conjunto de dados. Essas arquiteturas foram escolhidas de acordo com trabalhos da literatura com temática relacionada ao problema abordado. Após o treinamento das arquiteturas VGG-19, Inception, DenseNet, MobileNetV2, e Visual Transformer para o problema de classificação de imagem, o Visual Transformer obteve melhor resultado e também foi analisado com diferentes níveis de iluminação e três diferentes otimizadores. Também foi investigado se o aumento na quantidade de imagens de treino traria ganhos compensadores. O desempenho dos resultados foi comparado com outros dois conjuntos de dados. Ao final, o Visual Transformer foi o melhor modelo com acurácia de 82,6% no conjunto de dados original. O código usado para treino e avaliação dos modelos, assim como o conjunto de dados original criado estão disponíveis neste repositório de GitHub: https://github.com/afego/computervision.

 

Abstract:

 

This work aimed to develop an initial approach for the automatic classification of floods in the city of Rio de Janeiro. To this end, this work first created an original dataset composed of 4620 images separated into 78% for training and 22% for validation. This dataset was assembled with images from street cameras in the city of Rio over different months, at different times of the day and at different flood levels. After the dataset was properly analyzed and assembled in a balanced way, five neural network architectures were evaluated on this dataset. These architectures were chosen according to works in the literature with a theme related to the problem addressed. After training the VGG-19, Inception, DenseNet, MobileNetV2, and Visual Transformer architectures for the image classification problem, the Visual Transformer obtained the best result and was also analyzed with different lighting levels and three different optimizers. It was also investigated whether increasing the number of training images would bring compensating gains. The performance of the results was compared with two other datasets. In the end, the Visual Transformer was the best model with an accuracy of 82.6% on the original dataset. The code used for training and evaluating the models, as well as the original dataset created are available in this GitHub repository: https://github.com/afego/computervision.

 

Banca  examinadora:

 

Profa. Aura Conci, UFF – Presidente

Prof. Leandro Augusto Frata Fernandes, UFF

Profa. Flavia Cristina Bernardini, UFF

Prof. Aristófanes Corrêa Silva, UFMA

Prof. Raul Queiroz Feitosa, PUC-Rio

Related Posts

Leave a Reply