Defesa de Dissertação de Mestrado de Daniel Prett Campagna, 23/06/26, 10h, por videoconferência

A Data Provenance Model for the General Data Protection Regulation  

 

Resumo:

 

A aprovação do Regulamento Geral de Proteção de Dados (GDPR) trouxe uma revolução na forma como tratamos os dados pessoais. O GDPR aumenta a participação dos indivíduos no tratamento de seus dados e também introduz desafios técnicos, cujo descumprimento pode acarretar em multa de até 4% do faturamento anual da empresa descumpridora. Para facilitar os esforços de conformidade, as autoridades supervisoras publicaram documentos de orientação que traduzem as disposições da lei em listas de questões de conformidade. Técnicas de proveniência de dados têm sido usadas com sucesso para representar e verificar essas questões; ainda assim, uma parcela substancial delas permanece sem representação e, portanto, não pode ser verificada automaticamente. Para reduzir essa lacuna, nesta dissertação, estendemos a ontologia de proveniência GDPRov para abordar quatro questões de conformidade ainda não cobertas do GDPR Guidance for SMEs, publicado pela Data Protection Commission da Irlanda: o período de retenção de cada categoria de dados pessoais (CQ8), os procedimentos para manter os dados pessoais exatos e atualizados sem demora (CQ28), as políticas de retenção que garantem que os dados não sejam mantidos por mais tempo do que o necessário (CQ29) e a eliminação ou anonimização sistemática dos dados pessoais quando não são mais legalmente exigidos (CQ51). Reutilizando construtos do Data Privacy Vocabulary, da ontologia Time e da Semantic Sensor Network ontology, introduzimos uma representação causal que vincula o cumprimento da finalidade de coleta de dados ao acionamento da eliminação ou anonimização, uma relação que nenhum modelo de proveniência para o GDPR representava. Validamos o modelo estendido em três cenários reais de uso sobre a base de dados do programa de pós-graduação SAPOS, sob a política de privacidade do Trinity College Dublin, respondendo a cada questão com consultas SPARQL independentes do caso de uso. Como resultado, a cobertura do GDPR Guidance for SMEs aumenta de 32 para 36 de suas 65 questões, um aumento de 12,5% em relação ao modelo anterior, e uma análise das 29 questões ainda não cobertas revela cinco categorias reutilizáveis que apontam caminhos sistemáticos para extensões futuras.

 

Abstract:

 

The approval of the General Data Protection Regulation (GDPR) brought a revolution in the way we treat personal data. The GDPR increases individuals’ participation in the treatment of their data, and it also introduces technical challenges, whose failure can lead to a fine of up to 4% of the annual revenue of the offending enterprise. To facilitate compliance efforts, supervisory authorities have published guidance documents that translate the law provisions into checklists of compliance questions. Data provenance techniques have been successfully used to represent and check these questions, yet a substantial portion of them remains unrepresented and thus cannot be verified automatically. To narrow this gap, in this dissertation, we extend the GDPRov provenance ontology to address four previously uncovered compliance questions from the GDPR Guidance for SMEs, published by the Data Protection Commission of Ireland: the retention period of each personal-data category (CQ8), procedures to keep personal data accurate and up to date without delay (CQ28), retention policies that ensure data are held no longer than necessary (CQ29), and the systematic erasure or anonymization of personal data once they are no longer legally required (CQ51). Reusing constructs from the Data Privacy Vocabulary, the Time ontology, and the Semantic Sensor Network ontology, we introduce a causal representation that links the fulfilment of a data-collection purpose to the triggering of deletion or anonymization, a relationship no prior GDPR provenance model represents. We validate the extended model over three real use-case scenarios on the SAPOS graduate-program database under the Trinity College Dublin privacy policy, answering each question with use-case-independent SPARQL queries. As a result, the coverage of the GDPR Guidance for SMEs rises from 32 to 36 of its 65 questions, a 12.5% increase over the prior model, and an analysis of the remaining 29 uncovered questions reveals five reusable categories that chart systematic pathways for future extensions.

 

Banca  examinadora:

 

Profa. Vanessa Braganholo Murta, UFF

Profa. Flavia Cristina Bernardini, UFF

Prof. Altigran Soares da Silva, UFAM

Prof. Javam de Castro Machado, UFC

Related Posts

Leave a Reply