Defesa de Dissertação de Mestrado de Ganadev Prajapathy Chandrasekharan, 16/06/2025, 9h, por videoconferência

Defesa de Dissertação de Mestrado de Ganadev Prajapathy Chandrasekharan, 16/06/2025, 9h, por videoconferência

 

Link para defesa: https://meet.google.com/tmj-grdq-nqt

 

Class-Weighted Vision Transformer with Focal Loss and Synthetic Data Augmentation for Enhanced Sea Mine Detection Using Side-Scan Sonar

Resumo:

 

A detecção precisa de minas marítimas é crítica para a segurança marítima, dados os riscos significativos que representam para operações navais e embarcações civis. Imagens de sonar de varredura lateral tornaram-se uma ferramenta valiosa na detecção de minas, oferecendo visuais subaquáticos de alta resolução que permitem a identificação de potenciais perigos. No entanto, a disponibilidade limitada de dados de sonar rotulados, muitas vezes restrita devido à confidencialidade militar, situações perigosas e restrições operacionais, apresenta um desafio significativo no desenvolvimento de modelos de detecção robustos. Esta pesquisa introduz o uso de técnicas de aumento de dados sintéticos usando Redes Adversariais Generativas (GANs) e modelos de Difusão para abordar a questão da escassez de dados. O estudo explora a qualidade visual, diversidade e utilidade de imagens de sonar sintéticas geradas por ambas as abordagens e avalia seu impacto no desempenho dos modelos de detecção de minas marítimas. Esta pesquisa introduz um Vision Transformer (ViT) ponderado por classe com Perda Focal (Focal Loss), otimizado através de aumento de dados sintéticos. O estudo explora o impacto do rebalanceamento de classes na melhoria do desempenho do modelo, particularmente para objetos de sonar difíceis de classificar, como minas não identificadas e falsos positivos. Nossos resultados demonstram que modelos ViT treinados com funções de perda ponderadas por classe melhoram significativamente a precisão da classificação em condições de sonar desafiadoras. As descobertas destacam os benefícios do aumento de dados sintéticos e da otimização consciente de classe, oferecendo uma estratégia nova e eficaz para aprimorar a detecção de minas marítimas usando imagens de sonar de varredura lateral.

Abstract:

 

Detecting sea mines accurately is critical for maritime safety, given the significant threats they pose to naval operations and civilian vessels. Side-scan sonar imagery has become a valuable tool in mine detection, offering high-resolution underwater visuals that enable the identification of potential hazards. However, the limited availability of labeled sonar data, often restricted due to military confidentiality, dangerous situations and operational constraints, presents a significant challenge in developing robust detection models. This research introduces the usage of synthetic data augmentation techniques using Generative Adversarial Networks (GANs) and Diffusion models to address the data scarcity issue. The study explores the visual quality, diversity, and utility of synthetic sonar images generated by both approaches and evaluates their impact on the performance of sea mine detection models. This research introduces a class-weighted Vision Transformer (ViT) with Focal Loss, optimized through synthetic data augmentation. The study explores the impact of class rebalancing on improving model performance, particularly for hard-to-classify sonar objects such as unidentified mines and false positives. Our results demonstrate that ViT models trained with class-weighted loss functions significantly improve classification accuracy in challenging sonar conditions. The findings highlight the benefits of synthetic data augmentation and class-aware optimization, offering a novel and effective strategy for enhancing sea mine detection using side-scan sonar imagery.

Banca  examinadora:

 

Prof. Esteban Walter Gonzalez Clua, UFF – Presidente

Profa. Flavia Cristina Bernardini, UFF

Prof. Luiz Marcos Garcia Gonçalves, UFRN

Dr. Leandro Aparecido Simal Moreira, Marinha do Brasil

Related Posts

Leave a Reply