ࡱ> Y[X)`bjbj3{{t2222 > NjjVVVVV111$ h< 11111VV$yyy1VVy1yyyVJ NN(2:y$:0jy Y y yL11y11111o 111j1111NNN2NNN2 Classificao Multirrtulo em Cadeia: Novas Abordagens Classificao Multirrtulo um problema de aprendizado supervisionado no qual um ob- jeto pode estar associado a mltiplas classes (rtulos). Um mtodo com grande destaque utilizado para solucionar problemas de classificao multirrtulo conhecido como Clas- sifier Chains (CC). O mtodo CC realiza o treinamento de q classificadores binrios, onde q representa o nmero de rtulos. Cada classificador responsvel unicamente pela predio de um rtulo especfico. Esses q classificadores binrios so ligados em cadeia, de tal forma que cada classificador binrio torna-se capaz de incorporar, como novos atributos preditivos, os rtulos previamente preditos. O mtodo CC define a ordem dos classificadores (rtulos) de forma aleatria para induzir o modelo, entretanto o seu desempenho preditivo fortemente influenciado pela ordem dos rtulos na cadeia. Portanto, um dos grandes desafios relacionados ao mtodo CC a escolha de uma ordem de rtulos na cadeia que o leve a um melhor desempenho preditivo. Recentemente, algumas variaes do CC tm sido propostas. No entanto, todos esses trabalhos buscam encontrar uma nica cadeia que deve ser utilizada para todas as instncias a serem classi- ficadas. Por outro lado, neste trabalho, considera-se que a utilizao de uma cadeia mais adequada para cada instncia possa aumentar a capacidade preditiva do mtodo CC. Para isso, duas novas tcnicas foram propostas, denominadas: Lazy Classifier Chains (LCC) e One-To-One Classifier Chains (OOCC). Os experimentos mostram que os dois mtodos propostos LCC e OOCC so capazes de obter um desempenho preditivo superior aos seguintes mtodos do estado da arte: Binary Relevance, CC e Ensemble of Classifier Chains. 7>= Q } ~   C I " # SjrμμμμΫΫμμΉxμμmhdh\mHsH hdh7OJQJ^JmHsH hdh^OJQJ^JmHsH hdhIe!OJQJ^JmHsH hdhD!OJQJ^JmHsH#hdhv?6OJQJ^JmHsH hdhv?OJQJ^JmHsHhdOJQJ^JmHsH#hdhv?5OJQJ^JmHsH78  1$7$8$H$gdv?$1$7$8$H$`a$gdn7$1$7$8$H$`a$gdv?$1$7$8$H$a$gdv?$1$7$8$H$a$gdv?10:pyp/ =!"#$% 666666666vvvvvvvvv666666>6666666666666666666666666666666666666666666666666hH666666666666666666666666666666666666666666666666666666666666666666@@@ NormalCJ_HaJmH sH tH >A> Fonte parg. padroTiT 0 Tabela normal4 l4a ,k, 0 Sem lista 78!L!!!N!Y !!780000000  8@0( 7 B S  ?LX ,>BDJKQ * 7D!Ie!n7v?yp1\.1od^7@|aDP@UnknownGz Times New Roman5Symbol3& z Arial3: TimesG  MS Mincho-3 fg7K@Cambria qhj*j*  24J#HP)$P'v?26Classificao Multirrtulo em Cadeia: Novas AbordagensPablo Nascimento da SilvaPGOh+'0v(< HT t  8Classificao Multirrtulo em Cadeia: Novas AbordagensPablo Nascimento da Silva Normal.dotPG2Microsoft Office Word@F#@(@(GtVT$m O:&" WMFCM 1QlUT#m EMFQ {d   Rp@Times@0ZOJg H#qJ[(0ZZ͜0@00ÿ0S||(3: Times@Z0@Ln0Xdv%   T&W@@&LxClassificao MultirrH2''!,2,22^8!,,2T W@@ Ltulo em Cadeia: Novas Abordagens"82,SH28,2!H222'H82,822,8'TTW@@LP 6Rp@TimesJDqJhqJg H#qJpJ(0Z6Z͜0@00ÿ0deia: Novas Abordages3: Times@Z0@Ln0Xdv%  TT1@@LP - Tpw@@bLX T8w@@bRLClassificao Multirrtulo um problema de aprendizado supervisionado no qual um C,''!,,,,3Y2!!222,2N2!22,N,3,,2!,22-,22'22-!2'22-222222,2O TX{Q@@LPob22TTR{r@@RLP-!Ts{ @@s:L jeto pode estar associado a mltiplas classes (rtulos). 1,21222,1,',!2,''2,,221,1N22,'1,,'','1!!222'!1T {@@ LxUm mtodo com grande HN1N,2221,2N12!,23-Rp@Times002E0vQTw! ?0|)08/b1*3: Times@Z0@Ln0Xdv%  % T]@@HLdestaque utilizado para soluc2,',22,'2,,22'2-!,('22,T]@@H:Lionar problemas de classificao multirrtulo conhecido 22,!'2!22,N,''3-',,''!,,-,2'N2!!222',',222-,22 % Tdb@@LTcomo,2N2% Tld@@LX Clas C2'TTd@@LP-!Td@@Lh sifier Chains ',' C221'% Txb@@L\ (CC). G !CC! T,b^@@%LO mtodo CC realiza o treinamento de H N,222 CC !,,,, 2 !,2,N,22 2, % TT_d@@_LPq2% Tb@@Lp classificadores !,,''!,,22",' % TzD@@/Llbinrios, onde 22,!2'8222,8% TT{D@@{/LPq2% T D@@/!L representa o nmero de rtulos. 8",2!,(,2,82822N,!382,8!232'8T D@@ /L|Cada classificador resC,2,8,,''!-,22!9,8!,'TD@@/ L`ponsvel 222',3, % TH/@@Lunicamente pela predio de um22,,N,2,&3,,&2",2,-2&2,&2NT|0Hj @@0L\ rtulo &!222&Tk H? @@k  Ldespecfico. ,'3,,!-2&Tp@ HC @@@ LXEsses ='','&% TTD Ju @@D LPq2% Tv H@@v L classificadores binrios so &,,''!,,22"-'&22,!2'&',3 T*@@ Ldligados em 2,22'<,N<Tp*@@LXcadeia,,2,,T*@@3L, de tal forma que cada classificador binrio torna<2-<,<!2!N,<22,<,,2,<-,''!,,22!<22,!2<2"2,TT*@@LP-G!T*@@ Ldse capaz de ',<,&" WMFC Q,3,,<2, T -g@@NLincorporar, como novos atributos preditivos, os rtulos previamente preditos. 2,2!22!,!",2N2"2222'#,!222'"2!,222'"2'""222'"2!,2,N,2,"3!,22'"Th-@@h L`O mtodo H"N,222 T`@@LTCC CCT@@Ldefine a ordem dos classific2,!2,,2!2,N22'-,''!,T V @@#Ladores (rtulos) de forma aleatria,22!,'!!222'!3,!2!N,,,,2!,TTW p @@W LP Tq @@q L|para induzir o modelo, 3,!,322,!2N22,2 TX@@mWLentretanto o seu desempenho preditivo fortemente influenciado pela ordem dos rtulos ,2!,,222',22,(,N2,2222!,222,!2!,O-2,2!2,2,,222,,3!3,N22'!222& T|@@ L`na cadeia.2,,,3,,TT}@@}LP . T(]  @@ OLPortanto, um dos grandes desafios relacionados ao mtodo CC a escolha de uma 82!,222N22'2!,23,(2,',!2'!,-,22,22',3N,222CC,,,(,22,2,2N, T $? @@* Ltordem de rtulos na 2!2,N2-!222'2,T% ? @@%* 4Lcadeia que o leve a um melhor desempenho preditivo. ,,2-,22,3,2,,2NN,23!2,',N2-2222",222T ? @@* LhRecentemente, C,,,2,N,2- TLC  @@ ULalgumas variaes do CC tm sido propostas. No entanto, todos esses trabalhos buscam ,22N,'!2,!,,3,'!22!CC!,N!'22!2!222','!H2!,2,22!222'!,'','!!,2,22'!22',,O Td % @@ YLencontrar uma nica cadeia que deve ser utilizada para todas as instncias a serem classia,2,22!-!2N-22,--,3,,22-2,3,(,!2,,3-2,",22,(,'2',3,,',',",N,,''TT % @@ LP-F!TT % @@ LP L T) ? @@ L`ficadas. p!,,2,'Tl@)  @@@ LXPor oo82!2T$) @@ $Lutro lado, neste trabalho, considera2!2,222,',!,2,22,22'2,"-TT ) @@ LP-9!T8 )  @@ 'Lse que a utilizao de uma cadeia mais s',22,,2,,,,22,3N,,,2,,N,' T4 L @@ QLadequada para cada instncia possa aumentar a capacidade preditiva do mtodo CC. v,2,22,3,2,",-,2,2'-2,,22'',,2O,2,!,--2,,2,2,3!,22,22N-222CCTlM  @@M LXPara a8,!, % T   @@j 8Lisso, duas novas tcnicas foram propostas, denominadas: ''222,'222,',,2,,(!2!,N2!222','2,22O2,2,'% T   @@ j LLazy Classifier Chains (LCC)82',C2'','B222'!8CC!% T`  @@j LT e e+ % T`  @@ LTOnenH2,TT  @@ LP-r!TX  @@ LPTo82TT ? @@ LP-d!T@ C @@@ LOne Classifier Chains (OOCC). H2,C2''&WMFCQ,'C222'!HHCC!% TTD p @@D LP - TY @@ 6LOs experimentos mostram que os dois mtodos propostos H'/,22-!N,22'/N2'!-N/22,/2(/22'/N,222(/2!222'2'/T Y  @@ LlLCC e OOCC so =CC/-/HICC/',2 % T| C;@@&L\capazes ,,2-,,' T|D ;@@D&L\de obter2, 22,!T ;@@&EL um desempenho preditivo superior aos seguintes mtodos do estado da 2N 2,',N2,222 2!,222 '22,!2! ,2' ',222,' N,221' 22 ,',22 2, % Tp@@@LXarte: ,!,% TB{@@LlBinary Relevance=22',=,-,22-,% Tx|@@@|L\, CC e CC,% TBP @@LEnsemble of Classifier Chains=2',H2,2C2'','C222'% TTQ @i @@Q LP.TTj @ @@j LP - TT@@qLP -Rp@CambriaJD qJpJg H#qJ qJ(0ZZ͜0@00ÿ0f Classifier Chains7K@Cambri@Z0@Ln0Xdv%  TT(`@@KLP ;% 666666666666666666666666666666666666 6 66 6  6 66 6  6 66 6  6 66 6  6 66 6 66666666666666666666  .@Times- ,2 }Classificao Multirr      ;2 } tulo em Cadeia: Novas Abordagens         2 } _ @Times- 2  _2  2 RClassificao Multirrtulo um problema de aprendizado supervisionado no qual um                    2 ob 2 -_b2 : jeto pode estar associado a mltiplas classes (rtulos).               +2 TUm mtodo com grande      @Times--72 destaque utilizado para soluce       b2 _:ionar problemas de classificao multirrtulo conhecido            -2 como  -2  Clas    2 -_ 2  sifier Chains  -2 @ (CC). r C2 t%O mtodo CC realiza o treinamento de         - 2 q_ -%2  classificadores n -"2 binrios, onde     - 2 q_ -=2 ! representa o nmero de rtulos.          /2 Cada classificador res      2  ponsvel   -82 3unicamente pela predio de um        2 3z rtulo    2 3 especfico.   2 3Esses - 2 36q_ -82 3? classificadores binrios so      2 H ligados em     2 Hcadeia X2 H3, de tal forma que cada classificador binrio torna               2 H-_2 H se capaz de    2 \Nincorporar, como novos atributos preditivos, os rtulos previamente preditos.                      2 \ O mtodo d  2 qCC  52 qdefine a ordem dos classific      @2 qn#adores (rtulos) de forma aleatriae        2 qg _.2 qlpara induzir o modelo, s     2 Wentretanto o seu desempenho preditivo fortemente influenciado pela ordem dos rtulos                         2  na cadeia.   2  _2 OPortanto, um dos grandes desafios relacionados ao mtodo CC a escolha de uma                   )2 ordem de rtulos na       Y2 4cadeia que o leve a um melhor desempenho preditivo.              2 Recentemente,   2 Ualgumas variaes do CC tm sido propostas. No entanto, todos esses trabalhos buscam                 2 Yencontrar uma nica cadeia que deve ser utilizada para todas as instncias a serem classi               2  -_ 2  _2  ficadas.  2 Por oa  A2 $utro lado, neste trabalho, considera         2 -_F2 'se que a utilizao de uma cadeia mais       2 )Qadequada para cada instncia possa aumentar a capacidade preditiva do mtodo CC. c                   2 )Para a -_2 >8isso, duas novas tcnicas foram propostas, denominadas:            -52 >*Lazy Classifier Chains (LCC)      -2 > e -2 SOne  2 S-_2 STo 2 S-_72 SOne Classifier Chains (OOCC).      - 2 S _\2 z6Os experimentos mostram que os dois mtodos propostos               "2 zLCC e OOCC so   -2 capazes  2 de obter  s2 E um desempenho preditivo superior aos seguintes mtodos do estado da                 -2 arte: -#2 Binary Relevance    -2 +, CC e r -72 ]Ensemble of Classifier Chains       - 2 8._ 2 = _ 2  _@Cambria- 2  _ "System-՜.+,0( hp   Pablo Silva ' 7Classificao Multirrtulo em Cadeia: Novas Abordagens Ttulo  !"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOQRSTUVWZRoot Entry FP(\1Table WordDocument3SummaryInformation(vDocumentSummaryInformation8PCompObju  F#Documento do Microsoft Office Word MSWordDocWord.Document.89q