аЯрЁБс>ўџ 68ўџџџ5џџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџьЅСq`№ПФbjbjqPqP1&::ФџџџџџџЄ‚‚‚‚‚‚‚–Z Z Z Z n –Ќ Ж† † † † † a a a + - - - - - - $bhЪ:Q ‚a a a a a Q ‚‚† † лf ѓ ѓ ѓ a ‚† ‚† + ѓ a + ѓ ѓ ‚‚ѓ † z ћœ ёзZ  Lѓ  | 0Ќ ѓ Э ѓ ‚ѓ $a a ѓ a a a a a Q Q щ a a a Ќ a a a a –––ФZ –––Z –––‚‚‚‚‚‚џџџџ Resumo As organizaчѕes (sejam elas pњblicas ou privadas) detщm dados de seus clientes e funcionсrios, seja para pesquisa ou como forma de obter vantagens competitivas. Apesar de representarem um potencial ganho para as organizaчѕes, as consultas e o aprendizado realizado sobre esses dados podem apresentar riscos р privacidade dos indivэduos cujos dados se encontram nos datasets, podendo vazar dados sensэveis, como valor do salсrio, endereчo de residъncia, etc. Щ de responsabilidade dos donos dos dados garantir a privacidade dos indivэduos cujos dados se encontram no dataset em questуo. Desde que a Lei Geral de Proteчуo aos Dados (LGPD) entrou em vigor no Brasil, em agosto de 2020, qualquer organizaчуo deve cumprir obrigaчѕes legais em relaчуo р privacidade de dados em territѓrio brasileiro. Existem diversas tщcnicas e abordagens para garantir a privacidade de dados, em especial dos dados armazenados em Sistemas de Gerъncia de Banco de Dados (SGBDs), sejam eles relacionais ou nуo. Entretanto, nos dias atuais muitas organizaчѕes optam por armazenar seus dados em formato bruto em Data Lakes. Tais dados podem ser encontrados em mњltiplos formatos (e.g., JSON, XML, CSV, bancos relacionais, etc). Para conseguir consultar esses dados heterogъneos de forma integrada, os sistemas Polystore vъm sendo utilizados. Esses sistemas permitem que o usuсrio submeta uma consulta que integra dados em formatos heterogъneos por meio de uma sintaxe de consulta њnica. Entretanto, os sistemas Polystore nуo consideram questѕes de privacidade atщ o momento, delegando essa responsabilidade para os SGBDs que eles consultam. Mesmo que os SGBDs que um sistema Polystore consulta ofereчam recursos de privacidade, a integraчуo posterior dos dados pode trazer ameaчas. Somente remover os identificadores explэcitos (e.g., nome, CPF, etc.) e semi-identificadores (e.g., CEP) ou disponibilizar apenas resultados agregados pode nуo proporcionar proteчуo suficiente. Nessa dissertaчуo, propomos uma abordagem chamada DIMPLY para integrar mecanismos de privacidade em sistemas Polystore. Os usuсrios deste middleware submetem consultas na sintaxe do Polystore e recebem os resultados jс anonimizados, sem depender dos SGBDs subjacentes. Como tщcnica de privacidade, escolhemos a Privacidade Diferencial (com os mecanismos de Laplace, Gaussiano e Resposta Randєmica). Consideramos um contexto de consultas interativas e buscamos preservar a utilidade dos dados. Para avaliar o DIMPLY, utilizamos um dataset de exames de casos suspeitos do Vэrus da Zika (ZIKV) no Brasil, extraэdo do sistema do SUS GAL (Gerenciador de Ambiente Laboratorial). Os resultados indicaram que a soluчуo proposta foi capaz de anonimizar o retorno das consultas submetidas ao sistema Polystore, preservando a utilidade dos dados. Palavras-chave: Privacidade Diferencial, Polystores, Banco de Dados, Anonimizaчуo, Saњde. Abstract Organizations (whether public or private) retain the data of their customers and employees, either for research or as a way to gain competitive advantages. Although they represent a potential gain for organizations, the consultations and the learning carried out on these data can pose risks to the privacy of individuals whose data are in the datasets, and sensitive data such as salary value, residence address, etc. may be leaked. It is the responsibility of the data owners to guarantee the privacy of the individuals whose data are found in the data in question. Since the General Data Protection Law (LGPD) entered is valid in Brazil in August 2020, any organization must comply with legal obligations concerning data privacy in Brazilian territory. There are several techniques and approaches to ensure data privacy, especially data stored in Database Management Systems (DBMS), whether relational or not. However, nowadays many organizations choose to store their data in raw format in Data Lakes. Such data can be found in multiple formats (e.g., JSON, XML, CSV, relational databases, etc). To be able to query this heterogeneous data in an integrated way, Polystore systems have been used. These systems allow for the user to submit a query that integrates data in heterogeneous formats through a single query syntax. However, Polystore systems do not consider privacy issues so far, delegating this responsibility to the DBMS they consult. Even though the DBMS that a Polystore system queries offer privacy features, further data integration can bring threats. Simply removing the explicit identifiers (e.g., name, social security number, etc.) and semi-identifiers (e.g., zip code) or providing only aggregated results may not provide sufficient protection. In this dissertation, we propose an approach called DIMPLY to integrate privacy mechanisms into Polystore systems. Users of this middleware submit queries in Polystore syntax and receive the results already anonymized, without depending on the underlying DBMS. As a privacy technique, we chose Differential Privacy (with Laplace, Gaussian, and Randomized Response mechanisms). We consider a context of interactive queries and seek to preserve the usefulness of the data. To evaluate DIMPLY, we used a dataset of examinations of suspected cases of the Zika Virus (ZIKV) in Brazil, extracted from the SUS GAL (Laboratory Environment Manager) system. The results indicated that the proposed solution was able to anonymize the return of queries submitted to the Polystore system, preserving the usefulness of the data. Keywords: Differential Privacy, Polystores, Databases, Anonymization, Health. u } Э а > E Ш Ь G Q ‹  Е И  ж п zƒ%(CF1;]fоѕЙРНЦъэћэлЩИІИІИІИ”ИІИІИІИІИІИІИІИІИІИІИІИІИ”ИІИІИƒq#h§[{h5>К5CJOJQJ^JaJ h§[{hY^yCJOJQJ^JaJ#h§[{h5>К>*CJOJQJ^JaJ#h§[{h5>К6CJOJQJ^JaJ h§[{h5>КCJOJQJ^JaJ#h§[{hY^y5CJOJQJ^JaJ#h§[{hY^y5CJOJQJ^JaJ#h§[{h§[{5CJOJQJ^JaJ,ыьэGHIJKLMNOPQR[\uvФєьсььььььььььььььєьсьь $d№a$gd§[{d№gd§[{ $d№a$gd§[{Ф§ћ FLRZ[\ДМњ§§vzЂЅ,-ЊЎЮбъюэюl€;Btv~УФяняЬНЋ™‡яняняuяняняняняняняняuяняЬcяЬ#h§[{h5>К5CJOJQJ^JaJ#h§[{h5>К>*CJOJQJ^JaJ#h§[{hY^y5CJOJQJ^JaJ#h§[{hY^y5CJOJQJ^JaJ#h§[{h5>К5CJOJQJ^JaJh§[{5CJOJQJ^JaJ h§[{hY^yCJOJQJ^JaJ#h§[{h5>К6CJOJQJ^JaJ h§[{h5>КCJOJQJ^JaJ%/0PА…. АТA!А "А # $ %ААаАа а†œ˜žžžžžžžž666666666vvvvvvvvv666666>666666666666666666666666666Ј6666666666И666666666666hH66666666666666666666666666666666666666666666666666666666666666666p6F@ёџF NormaldCJ_HaJmHsHtHF@F Tэtulo 1$$$ЄЄxCJ(aJ(JJ Tэtulo 2$$$ЄhЄx 5€CJ aJ RR Tэtulo 3$$$Є@ЄP5€B*CJaJphCCCPP Tэtulo 4$$$ЄЄPB*CJaJphfffPP Tэtulo 5$$$Є№ЄPB*CJaJphfffRR Tэtulo 6$$$Є№ЄP6B*CJaJphfff>AђџЁ> Fonte parсg. padrуoTiѓџГT 0 Tabela normalі4ж l4жaі ,kєџС, 0 Sem lista XўѓџѓX Table Normal:VdCJ_HaJmHsHtHB>@B  Tэtulo$$$ЄЄ<CJ4aJ4dJ@d А Subtэtulo$$$ЄЄ@$6€B*CJOJPJQJ^JaJphfffФ&џџџџы ь э G H I J K L M N O P Q R [ \ uvЦ˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€ћФФФ№8№@ёџџџ€€€ї№’№№0№( № №№B №S №ПЫџ ?№}ЋЌавEFЬЭ QS‘ИЛпрƒ„(+FI;<fgѕї Р С Ц Ш ъ э ћ §  " F R Z \ М О § џ z|ЅЈ,-ЎАбдю№эю€‚БВBCtv~€УЦъ э F R Z \ tvУЦR \ ЦЦхY^y§[{5>КvЦџ@€О О аWіччО О Ф@@џџUnknownџџџџџџџџџџџџGџ:рAxР џTimes New Roman5€Symbol3& џ:рCxР џArial"ёˆ№аЉ­ œgсsœGf^ 'f^ '!№  ДДr4ЙЙBƒ№ќ§HP)№џ$PфџџџџџџџџџџџџџџџџџџџџџY^y2џџlcsHelioўџр…ŸђљOhЋ‘+'Гй0PˆœЈДРа рь   $08@HфlcsNormalHelio3Microsoft Office Word@вIk@–zЂЙцз@ˆёзf^ўџеЭеœ.“—+,љЎ0ш hp|„Œ” œЄЌД М Щф' Йц  Tэtulo ўџџџўџџџ !"#$ўџџџ&'()*+,ўџџџ./01234ўџџџ§џџџ7ўџџџўџџџўџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџRoot Entryџџџџџџџџ РFP:З ёз9€Data џџџџџџџџџџџџ1TableџџџџWordDocumentџџџџ1&SummaryInformation(џџџџџџџџџџџџ%DocumentSummaryInformation8џџџџџџџџ-CompObjџџџџџџџџџџџџuџџџџџџџџџџџџўџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџўџ џџџџ РF#Documento do Microsoft Office Word MSWordDocWord.Document.8є9Вq