ࡱ> /1.bjbjUU > ??  0$7K HjWWWWWWWWWWWW2jWW0WTWTWTWPWWWWWWWWWWWWWWWWTWWWWWWWWW :Resumo Com grandes quantidades de dados XML para analisar e consultas geralmente complexas e imprevisveis (ad hoc), a velocidade de obteno dos resultados pode determinar o sucesso ou fracasso de uma deciso em sistemas de apoio deciso. Desta forma, cada vez mais faz-se uso de abordagens de processamento paralelo para reduzir o tempo total de execuo. Nestas abordagens, a fragmentao dos dados uma etapa crucial, pois determina como se dar o processamento paralelo. Enquanto a fragmentao fsica realiza a fragmentao e distribuio dos dados antes da execuo das consultas, a fragmentao virtual determina em tempo de execuo os subintervalos sobre os quais cada n vai trabalhar. Assim, a fragmentao virtual torna-se mais adequada para cenrios ad hoc, nos quais as consultas realizadas so imprevisveis. No que se refere a consultas sobre dados XML, a nica abordagem que emprega a fragmentao virtual utiliza uma distribuio esttica de trabalho entre os ns ao processar somente um fragmento virtual em cada um deles. possvel que a existncia de uma distribuio no uniforme dos dados (data skew) ocasione problemas de balanceamento de carga entre os ns, afetando assim o tempo de execuo. Na fragmentao virtual aplicada sobre bases relacionais, a literatura mostra que possvel diminuir o tempo de execuo de consultas ao se dividir o intervalo de dados de entrada em um nmero maior de fragmentos, distribuindo-os dinamicamente durante a execuo. Desta forma, o principal objetivo deste trabalho realizar esse aumento no nmero de fragmentos e analisar o impacto no tempo de execuo de consultas com a tcnica de fragmentao virtual sobre dados XML. Como a anlise exige que seja utilizado algum mecanismo de distribuio dinmica de execuo, prope-se adicionar isso tcnica de duas formas diferentes e analisar as diferenas. A abordagem VPHadoop utiliza um framework MapReduce para cuidar dos aspectos inerentes ao processamento paralelo, enquanto a Partix-EVP faz uso de uma implementao interna de distribuio da execuo sobre uma infraestrutura MPI. Em experimentos, verificou-se que as novas abordagens distribudas propostas so capazes de reduzir o tempo de execuo de consultas XML de alto custo, se comparadas com a abordagem centralizada e com a abordagem PartiX-VP, que utiliza a distribuio esttica de trabalho. Contudo, a implementao da fragmentao virtual depende da infraestrutura e arquitetura adotada, o que pode limitar a sua aplicabilidade. Palavras-chave: XML, Fragmentao Virtual, Processamento Distribudo, Banco de dados, XQuery. ABSTRACT The ever-growing availability of XML data brought up the need for new XML processing techniques, so the results of this processing can be swiftly obtained and used. Decision support systems are an example of such need. With a great amount of data to analyze and queries usually complex and unpredictable (ad hoc), timely responses might dictate the success or failure of a decision. In this sense, parallel processing approaches have been increasingly employed to reduce the execution time. In these approaches, data partitioning is a very important step, as it sets how the parallel processing will take place. While physical partitioning breaks down the data into different fragments and distributes them before query execution, virtual partitioning determines subintervals for each node during execution, considering data replication among nodes. Thus, virtual partitioning is suitable for ad-hoc scenarios, in which queries are unknown beforehand. Considering queries over XML data, the only known approach that applies virtual partitioning uses static distribution of execution by processing only one virtual partition on each node. With that, data skew can lead to load unbalancing issues among processors during parallel execution, thus affecting total execution time. Research in virtual partitioning over relational data showed it is possible to reduce the query execution time by partitioning the input data range into more partitions and dynamically distributing them to available processors. Thus, the main objective of this work is to increase the number of partitions and analyze how it influences total execution time in virtual partitioning technique over XML data. Since varying the number of fragments requires the dynamic distribution of execution, this work proposes two approaches to realize that and compares their differences. VPHadoop employs a MapReduce framework to take care of parallel execution, while Partix-EVP implements a simple master-slave technique and uses a pure MPI infrastructure. Experimental evaluation shows that the new distributed approaches can reduce query execution time compared to both standalone and the original approach for virtual partitioning over XML, which uses static distribution. However, virtual partitioning implementation depends on the adopted architecture and infrastructure, which might limit its applicability. Keywords: XML, XQuery, Virtual Partitioning, Distributed Processing, Database lnor   ^ g u~:;r:CD춯쯶쨞zozaoahAA<h;5\mH sH hAA<h;mH sH h;mH sH "hAA<h;5CJ\aJmH sH hAA<h;5\hgz h;5\ hgz h; hVhh; hh;h5h;6]hch;6]h(h;6] h;6]hESh;6]h;hIh;5;CJ\aJ 789:CD $`a$gdAA<`gdAA<gdl%R $h`a$gdl%R<P1h:pl%R. A!n"n#n$n% Dpj  666666666666666666666666666666666666666666 6666666666 666666666666 6666666666666666666666666666666666666666666666666666666666666662 0@P`p2( 0@P`p 0@P`p 0@P`p 0@P`p 0@P`p 0@P`p8XV~ OJPJQJ_HmHnHsHtH\`\ l%RNormal$dh`a$ CJOJQJ_HaJmHsHtH DA D 0Default Paragraph FontRiR 0 Table Normal4 l4a (k ( 0No List PK![Content_Types].xmlj0Eжr(΢Iw},-j4 wP-t#bΙ{UTU^hd}㨫)*1P' ^W0)T9<l#$yi};~@(Hu* Dנz/0ǰ $ X3aZ,D0j~3߶b~i>3\`?/[G\!-Rk.sԻ..a濭?PK!֧6 _rels/.relsj0 }Q%v/C/}(h"O = C?hv=Ʌ%[xp{۵_Pѣ<1H0ORBdJE4b$q_6LR7`0̞O,En7Lib/SeеPK!kytheme/theme/themeManager.xml M @}w7c(EbˮCAǠҟ7՛K Y, e.|,H,lxɴIsQ}#Ր ֵ+!,^$j=GW)E+& 8PK!Ptheme/theme/theme1.xmlYOo6w toc'vuر-MniP@I}úama[إ4:lЯGRX^6؊>$ !)O^rC$y@/yH*񄴽)޵߻UDb`}"qۋJחX^)I`nEp)liV[]1M<OP6r=zgbIguSebORD۫qu gZo~ٺlAplxpT0+[}`jzAV2Fi@qv֬5\|ʜ̭NleXdsjcs7f W+Ն7`g ȘJj|h(KD- dXiJ؇(x$( :;˹! I_TS 1?E??ZBΪmU/?~xY'y5g&΋/ɋ>GMGeD3Vq%'#q$8K)fw9:ĵ x}rxwr:\TZaG*y8IjbRc|XŻǿI u3KGnD1NIBs RuK>V.EL+M2#'fi ~V vl{u8zH *:(W☕ ~JTe\O*tHGHY}KNP*ݾ˦TѼ9/#A7qZ$*c?qUnwN%Oi4 =3ڗP 1Pm \\9Mؓ2aD];Yt\[x]}Wr|]g- eW )6-rCSj id DЇAΜIqbJ#x꺃 6k#ASh&ʌt(Q%p%m&]caSl=X\P1Mh9MVdDAaVB[݈fJíP|8 քAV^f Hn- "d>znNJ ة>b&2vKyϼD:,AGm\nziÙ.uχYC6OMf3or$5NHT[XF64T,ќM0E)`#5XY`פ;%1U٥m;R>QD DcpU'&LE/pm%]8firS4d 7y\`JnίI R3U~7+׸#m qBiDi*L69mY&iHE=(K&N!V.KeLDĕ{D vEꦚdeNƟe(MN9ߜR6&3(a/DUz<{ˊYȳV)9Z[4^n5!J?Q3eBoCM m<.vpIYfZY_p[=al-Y}Nc͙ŋ4vfavl'SA8|*u{-ߟ0%M07%<ҍPK! ѐ'theme/theme/_rels/themeManager.xml.relsM 0wooӺ&݈Э5 6?$Q ,.aic21h:qm@RN;d`o7gK(M&$R(.1r'JЊT8V"AȻHu}|$b{P8g/]QAsم(#L[PK-![Content_Types].xmlPK-!֧6 +_rels/.relsPK-!kytheme/theme/themeManager.xmlPK-!Ptheme/theme/theme1.xmlPK-! ѐ' theme/theme/_rels/themeManager.xml.relsPK]  _GoBackTexto2 6 gz 5AA<Il%RVhES_;c(MW9@@@UnknownG*Ax Times New Roman5Symbol3" Arial7.@CalibriACambria Math"lHGlHG!nn0$Pl%R!xxRESUMOCV GABRIEL TESSAROLLIHelioOh+'0   D P \hpxRESUMOCV GABRIEL TESSAROLLINormal_WordconvHelio2Microsoft Office Outlook@Ik@ȅc@ȅc՜.+,0 hp|   RESUMO Title  !"#$%'()*+,-0Root Entry F^j21TableTWordDocument@ SummaryInformation(DocumentSummaryInformation8&CompObjy  F'Microsoft Office Word 97-2003 Document MSWordDocWord.Document.89q  F#Documento do Microsoft Office Word MSWordDocWord.Document.89q