
Defesa de Dissertação de Mestrado de Bruna de Mello Almeida, em 26/08/2024, às 14:00 horas, por videoconferência
Link para defesa: https://meet.google.com/utc-zsbh-xur
Otimização de Parâmetros em Aplicações de Big Data Baseadas em Múltiplos Frameworks
Resumo:
Os sistemas de gerência de banco de dados (SGBD) e os frameworks de computação distribuída são cruciais para aplicações que processam grandes volumes de dados. Configurá-los manualmente é complexo devido à quantidade e interdependência dos parâmetros. As soluções automáticas atuais necessitam de muitos exemplos e não otimizam a integração entre sistemas e frameworks. Esta dissertação avalia uma abordagem independente de modelo para configurar parâmetros de forma otimizada, integrando Apache Spark e o SGBD Cassandra. Os resultados mostram melhorias de até 69,99% com a otimização dos parâmetros de forma integrada, em comparação com os valores default de parâmetros dos frameworks.
Abstract:
Database management systems and distributed computing frameworks are crucial for applications that process large volumes of data. Configuring them manually is complex due to the number and interdependence of the parameters. Current automatic solutions require many examples and do not optimize system integration. This thesis evaluates a model-independent approach to configuring parameters optimally, integrating Apache Spark and Cassandra. The results show improvements of up to 69.99% with the integrated parameter optimization compared to the default parameter values.
Banca examinadora:
Prof. Yuri Abitbol de Menezes Frota, UFF – Presidente
Prof. Daniel Cardoso Moraes de Oliveira, UFF
Profa. Isabel Cristina Mello Rosseti, UFF
Prof. José Maria da Silva Monteiro Filho, UFC