
A Platform for Breast Diagnosis from Frontal Thermographies
Resumo:
O câncer de mama continua sendo um desafio significativo para a saúde global, no qual a detecção precoce é primordial. Embora a mamografia seja o método padrão de rastreamento, suas limitações em custo, acessibilidade e eficácia em tecido denso têm motivado a busca por alternativas. A termografia médica, uma modalidade de imagem não invasiva e livre de radiação, apresenta-se como uma ferramenta complementar promissora. Contudo, a transição de modelos de aprendizado de máquina de protótipos de pesquisa para aplicações clínicas confiáveis é dificultada por desafios em reprodutibilidade, escalabilidade e rigor metodológico.
Esta tese enfrenta esses desafios através do desenvolvimento de uma plataforma robusta baseada em Operações de Aprendizado de Máquina (MLOps) e micro serviços, que integra o ciclo de vida completo de modelos de Deep Learning, desde a ingestão e pré processamento automatizado até à disponibilização de uma aplicação funcional de inferência. O sistema utiliza um conjunto de ferramentas modernas incluindo Apache Airflow, MLflow, Docker e FastAPI para automatizar e gerenciar todo o ciclo de vida do modelo. Uma contribuição central deste trabalho é sua estrita aderência a uma metodologia de separação de dados por paciente, que aborda o problema crítico do vazamento de dados (data leakage) prevalente na literatura anterior e garante uma avaliação válida da generalização do modelo.
Um modelo baseado na arquitetura EfficientNet-B0 foi desenvolvido e avaliado, utilizando uma estratégia de treinamento multiestágio com o descongelamento progressivo de camadas. Em um conjunto de dados de imagens de mamas segmentadas, o modelo alcançou um desempenho promissor, com uma acurácia de aproximadamente 92.29%, uma precisão de 100% e um recall de 85.83%.
Em última análise, esta tese fornece um plano abrangente para construir, validar e implantar sistemas de aprendizado de máquina robustos e confiáveis em um contexto médico. Ela demonstra um caminho claro da pesquisa acadêmica para um auxílio diagnóstico prático e acessível, contribuindo com um framework metodologicamente sólido e uma aplicação de prova de conceito (Proof of Concept) funcional para futuras inovações em aplicações computacionais de imagens médicas.
Abstract:
Breast cancer remains a significant global health challenge where early detection is paramount. While mammography is the standard screening method, its limitations in cost, accessibility, and efficacy in dense tissue have motivated the search for alternatives. Medical thermography, a non-invasive and radiation-free imaging modality, presents a promising complementary tool. However, the translation of machine learning models from research prototypes into reliable clinical applications is hindered by challenges in reproducibility, scalability, and methodological rigor.
This thesis confronts these challenges through the development of a robust platform based on Machine Learning Operations (MLOps) and microservices, integrating the complete Deep Learning model lifecycle, from automated ingestion and preprocessing to the deployment of a high-performance inference application. The system leverages a modern stack including Apache Airflow, MLflow, Docker, and FastAPI to automate and govern the entire model lifecycle. A core contribution of this work is its strict adherence to a patient-wise data separation methodology, which addresses the critical issue of data leak age prevalent in prior literature and ensures a valid assessment of model generalization.
A model based on the EfficientNet-B0 architecture was developed and evaluated, using a multi-stage training strategy with progressive layer unfreezing. On a segmented breast dataset, the model achieved promising performance, with an accuracy of approximately 92.29%, a precision of 100%, and a recall of 85.83%.
Ultimately, this thesis provides a comprehensive blueprint for building, validating, and deploying robust and reliable machine learning systems in a medical context. It demonstrates a clear pathway from academic research to a functional diagnostic Proof of Concept (PoC), contributing a methodologically sound framework for future innovation in computational medical imaging.
Banca examinadora:
Profa. Aura Conci, UFF
Profa. Vanessa Braganholo Murta, UFF
Prof. Leonardo Gresta Paulino Murta, UFF
Prof. Geraldo Braz Júnior, UFMA
Prof. João Dallyson Sousa de Almeida, UFMA