ࡱ> /1.bjbjUU > ??|| 7999999.v99N77EK#d0099| :Resumo: Workflows cientficos so modelos compostos por atividades, dados e dependncias entre dados cujo objetivo representar uma simulao computacional. No geral, estes workflows demandam por muitos recursos computacionais, pois suas execues envolvem diferentes programas e um grande volume de dados. Desta forma, o uso de ambientes de Computao de Alto Desempenho (CAD) e tcnicas de paralelizao se tornam essenciais. Nos ltimos anos, a Computao em Nuvem vem amadurecendo e se mostrando como uma boa alternativa para a composio destes ambientes, devido a vantagens como facilidade de aquisio, baixo custo inicial e limite de recursos virtualmente inexistente, entre outras. Entretanto, a ocorrncia de falhas em tais ambientes deve ser tratada como regra e no como exceo. Existem diversas tcnicas que podem ser aplicadas ou adaptadas ao contexto de workflows cientficos com o objetivo de tornar suas execues capazes de suportar falhas com o mnimo impacto possvel, tais como reexecuo, checkpoint-restart e replicao. Este trabalho explora estas tcnicas e as analisa aplicadas em casos de workflows cientficos reais. Foram implementadas as tcnicas checkpoint-restart e replicao no Sistema de Gerncia de Workflos Cientficos (SGWfC) SciCumulus, e estas foram comparadas tcnica de reexecuo, tcnica mais comumente adotada pelos SGWfC atuais. Por fim, foi realizado um estudo inicial sobre tcnicas de Aprendizado de Mquina que auxiliam o cientista na tomada de deciso a respeito de qual tcnica seria melhor aplicada a uma determinada tarefa, possibilitando escolhas mais adequadas ao ambiente computacional disponvel e a tarefa a ser executada. O uso deste framework de tolerncia a falhas melhorou a resilincia do SGWfC SciCumulus ao custo de um reduzido overhead, proporcionando a execuo de workflows cientficos de forma mais estvel, rpida e barata com ganhos de at 30% nos experimentos realizados - mesmo em situaes de adversidade. Palavras-chave: computao em nuvem; computao de alto desempenho; workflows cientficos; tolerncia a falhas Abstract: Scientific workflows are models composed of activities, data and dependencies whose objective is to represent a computer simulation. In general, these workflows demand for many computational resources as their executions may involve numerous programs processing a considerable volume of data. Thus, the use of High Performance Computing (HPC) environments allied to parallelization techniques becomes imperative. Over the last years, Cloud Computing has been continuously improved and hence appears as a good candidate to the composition of HPC environments, due to advantages such as easy acquisition, low up-front investiment and virtually non-existent resource limit. However, failure occurrence in such environments is rather a reality than a possibility. There are many fault tolerance techniques that may be applied or adapted to the scientific workflow context, such as re-execution, checkpoint-restart and replication. This work explores these techniques and analyzes their application to real scientific workflow use cases. The checkpoint-restart and replication techniques were implemented in the SciCumulus Scientific Workflow Management System (SWfMS) and compared to the re-execution technique, used as baseline as it is the most commonly adopted fault tolerance technique by current SWfMS. Finally, an initial study on machine learning techniques was conducted in order to assist scientists in the task of choosing the most appropriate fault tolerance technique for a given task, enabling choices well suited for both the task and the currently available computational environment. The use of this fault tolerance framework improved the resilience of the SciCumulus SWfMS at the cost of a low overhead, producing more stable workflow executions in a faster and cheaper manner - with up to 30% improvements obtained at the experiments - even in adverse situations. Keywords: cloud computing; high performance computing; scientific workflows; fault tolerance techniques g p  ^ g -6IRS.NXYJKPQ[\  [\  ijnohP;hQz]mH sH hQz]mH sH hP;hQz]5\mH sH hP;hQz]6]hQz]hP;hQz]5\K3456789:;<=>?@ABCDEFGHIgdP;$a$gdP;gdP;<P1h:pQz]. A!"#$% Dp^ 666666666vvvvvvvvv666666>6666666666666666666666666666666666666666666666666hH6666666666666666666666666666666666666666666666666666666666666666662 0@P`p2( 0@P`p 0@P`p 0@P`p 0@P`p 0@P`p 0@P`p8XV~_HmHnHsHtH@`@ NormalCJ_HaJmHsHtHDA D 0Default Paragraph FontRiR 0 Table Normal4 l4a (k ( 0No List PK![Content_Types].xmlj0Eжr(΢Iw},-j4 wP-t#bΙ{UTU^hd}㨫)*1P' ^W0)T9<l#$yi};~@(Hu* Dנz/0ǰ $ X3aZ,D0j~3߶b~i>3\`?/[G\!-Rk.sԻ..a濭?PK!֧6 _rels/.relsj0 }Q%v/C/}(h"O = C?hv=Ʌ%[xp{۵_Pѣ<1H0ORBdJE4b$q_6LR7`0̞O,En7Lib/SeеPK!kytheme/theme/themeManager.xml M @}w7c(EbˮCAǠҟ7՛K Y, e.|,H,lxɴIsQ}#Ր ֵ+!,^$j=GW)E+& 8PK!Ptheme/theme/theme1.xmlYOo6w toc'vuر-MniP@I}úama[إ4:lЯGRX^6؊>$ !)O^rC$y@/yH*񄴽)޵߻UDb`}"qۋJחX^)I`nEp)liV[]1M<OP6r=zgbIguSebORD۫qu gZo~ٺlAplxpT0+[}`jzAV2Fi@qv֬5\|ʜ̭NleXdsjcs7f W+Ն7`g ȘJj|h(KD- dXiJ؇(x$( :;˹! I_TS 1?E??ZBΪmU/?~xY'y5g&΋/ɋ>GMGeD3Vq%'#q$8K)fw9:ĵ x}rxwr:\TZaG*y8IjbRc|XŻǿI u3KGnD1NIBs RuK>V.EL+M2#'fi ~V vl{u8zH *:(W☕ ~JTe\O*tHGHY}KNP*ݾ˦TѼ9/#A7qZ$*c?qUnwN%Oi4 =3ڗP 1Pm \\9Mؓ2aD];Yt\[x]}Wr|]g- eW )6-rCSj id DЇAΜIqbJ#x꺃 6k#ASh&ʌt(Q%p%m&]caSl=X\P1Mh9MVdDAaVB[݈fJíP|8 քAV^f Hn- "d>znNJ ة>b&2vKyϼD:,AGm\nziÙ.uχYC6OMf3or$5NHT[XF64T,ќM0E)`#5XY`פ;%1U٥m;R>QD DcpU'&LE/pm%]8firS4d 7y\`JnίI R3U~7+׸#m qBiDi*L69mY&iHE=(K&N!V.KeLDĕ{D vEꦚdeNƟe(MN9ߜR6&3(a/DUz<{ˊYȳV)9Z[4^n5!J?Q3eBoCM m<.vpIYfZY_p[=al-Y}Nc͙ŋ4vfavl'SA8|*u{-ߟ0%M07%<ҍPK! ѐ'theme/theme/_rels/themeManager.xml.relsM 0wooӺ&݈Э5 6?$Q ,.aic21h:qm@RN;d`o7gK(M&$R(.1r'JЊT8V"AȻHu}|$b{P8g/]QAsم(#L[PK-![Content_Types].xmlPK-!֧6 +_rels/.relsPK-!kytheme/theme/themeManager.xmlPK-!Ptheme/theme/theme1.xmlPK-! ѐ' theme/theme/_rels/themeManager.xml.relsPK]   P;Qz]lgvrL>@@@UnknownG*Ax Times New Roman5Symbol3" ArialACambria Math"kdkd !0$PP;!xxResumo: Workflows cientficos so modelos compostos por atividades, dados e dependncias entre dados cujo objetivo representar uma simulao computacionalHelioHelioOh+'0@L\ht    Resumo: Workflows cientficos so modelos compostos por atividades, dados e dependncias entre dados cujo objetivo representar uma simulao computacionalHelioNormal_WordconvHelio2Microsoft Office Outlook@q@t+#I@;K ՜.+,0 hp|  e Resumo: Workflows cientficos so modelos compostos por atividades, dados e dependncias entre dados cujo objetivo representar uma simulao computacional Title  !"#$%'()*+,-0Root Entry F3EK21TableWordDocument> SummaryInformation(DocumentSummaryInformation8&CompObjy  F'Microsoft Office Word 97-2003 Document MSWordDocWord.Document.89q  F#Documento do Microsoft Office Word MSWordDocWord.Document.89q