ࡱ> 130WbjbjUU >"??W?????SSSSg SJssssssssZ\?sssss??ssssss?s?sssssss!W<Sss0JsXsXssX?HssssssssssssJssssXsssssssss :Resumo: O presente avano tecnolgico vem permitindo a gerao de um grande volume de dados, no apenas coletados de sensores, mas tambm em bases de dados abertos governamentais que representam aspectos socioeconmicos e polticos referentes s diversas naes do globo. Apesar dos inmeros benefcios trazidos para a comunidade pela oferta de dados abertos --- disponveis em formatos compreensveis por especialistas do domnio e/ou especialista em dados ---, o seguinte desafio ainda no foi respondido: --- Como podemos apoiar o cidado na interpretao de conjuntos de dados regionais referentes a aspectos distintos e na identificao de relaes entre esses aspectos ou de padres de interesse. Como a interpretao desses conjuntos de dados no uma tarefa trivial, a busca por tcnicas e metodologias que permitam a interpretao de informaes implcitas e deduo de novos conhecimentos se torna imprescindvel. A utilizao de tcnicas de descoberta de conhecimentos em base de dados (knowledge discovery in databases - KDD), por meio da minerao de dados, permite a aquisio de conhecimentos, padres, ou modelos, com uma estrutura vlida e interpretvel. Em particular, algoritmos de aprendizado no-supervisionado, ou algoritmos de clusterizao, para encontrar agrupamentos de dados semelhantes entre si, tm sido muito utilizados. A clusterizao de dados urbanos abraa muitos exemplos onde o comportamento e anlises de padres em regies geogrficas, dividido por sub-regies locais, necessria, embora haja uma falta de ferramentas para isso. Aprendizagem no supervisionada oferece vrios algoritmos e ferramentas que facilitam essas tarefas, embora algoritmos tpicos no considerem restries de contiguidade espacial, definidas pelas fronteiras entre regies. Este trabalho prope novos algoritmos de clusterizao semi-supervisionada, que consideram a restrio de contiguidade espacial, baseados no K-means e em um algoritmo de clusterizao hierrquica. Para a avaliao dos algoritmos foi realizada uma anlise exploratria utilizando um conjunto de dados governamentais abertos, com base em medidas de critrios relativos. A avaliao dos experimentos exibiu bons resultados considerando essas medidas, e observou-se que os algoritmos geraram clusters compactos e com um bom poder de predio. Palavras-Chaves: Clusterizao com restrio de contiguidade espacial; clusterizao semi-supervisionada; Regionalizao. Abstract: Nowadays, the technological advance has allowed the generation of a large volume of data, comprising not only data collected from sensors, but also in open government data representing socio-economic and political aspects for the various nations of the globe. Despite the numerous benefits brought to the community by open data offerings which are available in formats understandable by domain experts and/or data experts , the following challenge has not yet been answered: How can we support the citizen in the interpretation of regional datasets relating to different aspects and identifying relationships between these features or patterns of interest?. As the interpretation of these data sets is not a trivial task, the search for techniques and methodologies for the interpretation of implicit information and introduction of new knowledge becomes essential. The use of techniques of knowledge discovery in databases (knowledge discovery in databases - KDD), through data mining, allows the acquisition of knowledge, patterns, or models with a valid and interpretable structure. In particular, unsupervised learning algorithms or clustering algorithms, to find clusters of items similar to each other, they have long been used. Urban data clustering embraces many examples where is required the pattern analysis in geographical regions, divided by local sub-regions, although there is a lack of tools for such analysis. Unsupervised learning offers several algorithms and tools that facilitate these tasks, although typical algorithms do not consider restrictions on spatial contiguity, defined by boundaries between regions. This paper proposes new semi-supervised clustering algorithms that consider the spatial contiguity constraint, based on K-means and a hierarchical clustering algorithm. For the evaluation of such algorithms, an exploratory analysis was performed using a set of open government data, based on relative criteria measures. The evaluation of the experiments showed good results considering these measures, and it was observed that the algorithms generated compact clusters with good predictive power. Keywords: Spatially constrained clustering; Semi-supervising learning; Regionalization   .0y˵˵˙˙˙˅sdM9M'h5B*CJOJQJaJmHphsH-hRx=h5B*CJOJQJaJmHphsHh55OJQJ\mHsH"hrhh55OJQJ\mHsH'hrhh5OJQJ^JmHnH sHu6hrhh56B*OJQJ]^JmHnH phsHu*h5B*OJQJ^JmHnH phsHu0hrhh5B*OJQJ^JmHnH phsHu6hrhh55B*OJQJ\^JmHnH phsHu W$a$gdM%$ 2( Px 4 #\'*.25@9dha$gdrh  WhRx=h5CJOJQJaJh5CJOJQJaJh55CJOJQJ\aJ"hRx=h55CJOJQJ\aJ<P1h:pI|. A!"#$% Dpj 666666666vvvvvvvvv666666>6666666666666666666666666666666666666666666666666hH6666666666666666666666666666666666666666666666666666666666666666662 0@P`p2( 0@P`p 0@P`p 0@P`p 0@P`p 0@P`p 0@P`p8XV~ OJPJQJ_HmHnHsHtHL`LNormal#CJ^J_HaJmHnHsH tH uDA D 0Default Paragraph FontRiR 0 Table Normal4 l4a (k ( 0No List e` rh0HTML Preformatted7 2( Px 4 #\'*.25@9CJOJQJ^JaJtHul/lO0HTML Preformatted Char'CJOJQJ^JaJmHnHsH tH uf/f rh0HTML Preformatted Char1 CJOJQJ^JaJmH sH tHPK![Content_Types].xmlj0Eжr(΢Iw},-j4 wP-t#bΙ{UTU^hd}㨫)*1P' ^W0)T9<l#$yi};~@(Hu* Dנz/0ǰ $ X3aZ,D0j~3߶b~i>3\`?/[G\!-Rk.sԻ..a濭?PK!֧6 _rels/.relsj0 }Q%v/C/}(h"O = C?hv=Ʌ%[xp{۵_Pѣ<1H0ORBdJE4b$q_6LR7`0̞O,En7Lib/SeеPK!kytheme/theme/themeManager.xml M @}w7c(EbˮCAǠҟ7՛K Y, e.|,H,lxɴIsQ}#Ր ֵ+!,^$j=GW)E+& 8PK!Ptheme/theme/theme1.xmlYOo6w toc'vuر-MniP@I}úama[إ4:lЯGRX^6؊>$ !)O^rC$y@/yH*񄴽)޵߻UDb`}"qۋJחX^)I`nEp)liV[]1M<OP6r=zgbIguSebORD۫qu gZo~ٺlAplxpT0+[}`jzAV2Fi@qv֬5\|ʜ̭NleXdsjcs7f W+Ն7`g ȘJj|h(KD- dXiJ؇(x$( :;˹! I_TS 1?E??ZBΪmU/?~xY'y5g&΋/ɋ>GMGeD3Vq%'#q$8K)fw9:ĵ x}rxwr:\TZaG*y8IjbRc|XŻǿI u3KGnD1NIBs RuK>V.EL+M2#'fi ~V vl{u8zH *:(W☕ ~JTe\O*tHGHY}KNP*ݾ˦TѼ9/#A7qZ$*c?qUnwN%Oi4 =3ڗP 1Pm \\9Mؓ2aD];Yt\[x]}Wr|]g- eW )6-rCSj id DЇAΜIqbJ#x꺃 6k#ASh&ʌt(Q%p%m&]caSl=X\P1Mh9MVdDAaVB[݈fJíP|8 քAV^f Hn- "d>znNJ ة>b&2vKyϼD:,AGm\nziÙ.uχYC6OMf3or$5NHT[XF64T,ќM0E)`#5XY`פ;%1U٥m;R>QD DcpU'&LE/pm%]8firS4d 7y\`JnίI R3U~7+׸#m qBiDi*L69mY&iHE=(K&N!V.KeLDĕ{D vEꦚdeNƟe(MN9ߜR6&3(a/DUz<{ˊYȳV)9Z[4^n5!J?Q3eBoCM m<.vpIYfZY_p[=al-Y}Nc͙ŋ4vfavl'SA8|*u{-ߟ0%M07%<ҍPK! ѐ'theme/theme/_rels/themeManager.xml.relsM 0wooӺ&݈Э5 6?$Q ,.aic21h:qm@RN;d`o7gK(M&$R(.1r'JЊT8V"AȻHu}|$b{P8g/]QAsم(#L[PK-![Content_Types].xmlPK-!֧6 +_rels/.relsPK-!kytheme/theme/themeManager.xmlPK-!Ptheme/theme/theme1.xmlPK-! ѐ' theme/theme/_rels/themeManager.xml.relsPK] W"WW IRx=MP^`rhj{$~765WY@W@@UnknownG*Ax Times New Roman5Symbol3" Arial7@CambriaO=  jMS Mincho l r   O1 CourierCourier New?= *Cx Courier NewACambria Math"*I'*I'z!0$PWrh!xxResumo: Leandro AlvesHelioOh+'0  < H T`hpxResumo:Leandro AlvesNormal_WordconvHelio4Microsoft Office Outlook@@Y~@P0z՜.+,0 hp|   Resumo: Title !"#$%&')*+,-./2Root Entry F^<41TableXWordDocument>"SummaryInformation( DocumentSummaryInformation8(CompObjy  F'Microsoft Office Word 97-2003 Document MSWordDocWord.Document.89q  F#Documento do Microsoft Office Word MSWordDocWord.Document.89q