
Avaliação de Técnicas de Inteligência Artificial para Previsão de Eventos Extremos de Precipitação no Rio de Janeiro a partir de Dados de Séries Temporais Multivariadas
Resumo:
A cidade do Rio de Janeiro possui características topográficas específicas, com a presença de maciços montanhosos em proximidade a regiões planas e costeiras. Esta condição torna desafiadora a tarefa de previsão de eventos meteorológicos extremos, como chuvas intensas, bem como a mitigação de suas consequências. Este trabalho tem o objetivo de avaliar a viabilidade de técnicas de Aprendizado de Máquina para a tarefa de previsão de curtíssimo prazo (nowcasting) de eventos de precipitação intensa no município do Rio de Janeiro, a partir de séries temporais multivariadas provenientes de estações meteorológicas, boias meteoceanográficas e radiossondagens. Os modelos selecionados (1D-CNN, LSTM, CNN-LSTM, DLinear e PatchTST) também são avaliados quanto ao compromisso entre desempenho preditivo e eficiência energética, comparando-se o consumo de energia e tempo de execução durante a fase de treinamento. Experimentos para previsão de temperatura foram conduzidos para validação da implementação dos modelos. A previsão de precipitação foi avaliada, considerando variações na seleção de atributos e na localização das estações meteorológicas, além da utilização de uma função de perda adaptada para penalização de erros em faixas de precipitação intensa (wMSE). Uma abordagem alternativa de detecção de anomalias com um modelo Autoencoder também foi explorada, avaliando sua viabilidade para identificação de eventos de precipitação intensa. Os resultados indicam bom desempenho e generalização para previsão de temperatura. A previsão de precipitação apresenta degradação acentuada nas faixas mais intensas, com modelos 1D-CNN, LSTM e CNN-LSTM tendendo ao sobreajuste aos dados de treino. A função de perda wMSE melhora o treinamento em alguns cenários, sem apresentar ganhos robustos com dados de teste. A análise de custo energético aponta o modelo 1D-CNN como o mais eficiente na fase de treino, tornando-o candidato a pesquisas futuras com foco na melhoria da capacidade de generalização. O modelo Autoencoder para detecção de chuva intensa apresenta baixa precisão para a classe positiva, demostrando dificuldade em detectar padrões que diferenciem os eventos de precipitação normal e anomalias a partir dos dados utilizados. Em geral, os resultados sugerem que a complexidade dos fenômenos meteorológicos associados à precipitação intensa, aliada ao desbalanceamento severo da variável alvo e à baixa resolução temporal dos dados, impõem limitações significativas à capacidade de generalização dos modelos de aprendizado de máquina avaliados.
Abstract:
The city of Rio de Janeiro exhibits distinctive topographic characteristics, with mountain massifs in close proximity to flat and coastal regions. This configuration makes the forecasting of extreme meteorological events, such as heavy rainfall, as well as the mitigation of their consequences, particularly challenging. The objective of this work is to evaluate the feasibility of Machine Learning techniques for very short-term forecasting (nowcasting) of intense precipitation events in the municipality of Rio de Janeiro, based on multivariate time series derived from meteorological stations, meteoceanographic buoys, and weather balloons. The selected models (1D-CNN, LSTM, CNN-LSTM, DLinear, and PatchTST) are also evaluated for the trade-off between predictive performance and energy efficiency, comparing energy consumption and execution time during the training phase. Experiments were conducted for temperature forecasting to validate the implementation of the models. Subsequently, precipitation forecasting was evaluated, considering variations in feature selection and in the location of meteorological stations. In addition, a customized loss function (wMSE) is employed to penalize errors in ranges of intense precipitation. An alternative anomaly detection approach using an Autoencoder model was also explored, investigating its feasibility for identifying intense precipitation events. The results indicate good performance and generalization for temperature forecasting. Precipitation forecasting, shows a marked degradation in the higher-intensity ranges, with 1D-CNN, LSTM, and CNN-LSTM models tending to overfit the training data. The wMSE loss function improves training in some scenarios but does not yield robust gains on test data. The energy cost analysis identifies the 1D-CNN model as the most efficient during the training phase, making it a candidate for future research focused on improving generalization capability. The Autoencoder model for heavy rainfall detection shows low precision for the positive class, demonstrating difficulty in detecting patterns that differentiate normal precipitation events from anomalies based on the available data. Overall, the results suggest that the complexity of meteorological phenomena associated with intense precipitation – combined with the severe imbalance of the target variable and the low temporal resolution of the data – imposes significant limitations on the generalization capability of the evaluated machine learning models.
Banca examinadora:
Profa. Mariza Ferro, UFF
Prof. Daniel Cardoso Moraes de Oliveira, UFF
Prof. Eduardo Bezerra da Silva, CEFET-RJ