аЯрЁБс>ўџ %'ўџџџ$џџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџьЅС'`№Пbjbj"9"9.@S@SџџџџџџЄЄЄЄЄЄЄЄИмммм ш ИЖ $ChЋ2Є2ЄЄGшшшІЄЄ ш шшЄЄшє 1гЃ2ЭмІ.ш ]0шЙ д Й шЙ Єш$ш22о ИИИ$мИИИмИИИЄЄЄЄЄЄџџџџ Este trabalho contribui para a сrea de recuperaчуo de informaчуo (information retrieval) que utiliza a tщcnica de agrupamento de documentos (document clustering) para apoiar a busca e recuperaчуo textos em grandes bases textuais. A maioria dos agrupadores textuais sуo desenvolvidos para domэnios especэficos. Quando usados em domэnios diferentes, apresentam uma quebra do seu desempenho, dificultando a recuperaчуo de textos. Essa dependъncia do domэnio estс intimamente ligada р escolha dos atributos que sуo usados para fazer o agrupamento e р definiчуo do conjunto de palavras que devem ser retiradas (stopwords). Os atributos e as stopwords  constituem a base para a definiчуo do corte de Luhn. Este trabalho explora a hipѓtese de que haverс melhoria do desempenho dos agrupadores de documentos atravщs da inclusуo de sumarizaчуo dos documentos, na fase de prщ-processamento, e do uso do processo de agrupamento hierсrquico dos documentos, na fase de processamento. Como contribuiчуo fundamental, foi ainda definido um novo mщtodo para o corte de Luhn, em vista de se melhorar o desempenho do agrupamento de textos, com o ganho adicional de passar-se a ter independъncia tanto do domэnio como do idioma. Para a avaliaчуo desta hipѓtese foi desenvolvido o modelo Cassiopeia, integrando estas novidades metodolѓgicas, modelo esse que foi testado com corpora de  bases pњblicas, oriundos dos domэnios jornalэstico, jurэdico e mщdico, e para os idiomas portuguъs e inglъs. Os resultados obtidos mostram um grande avanчo no desempenho do agrupamento de documentos usando o Cassiopeia, avanчo esse medido em termos das usuais mщtricas de precisуo, recuperaчуo de informaчуo, coesуo e acoplamento. Em consequъncia deste avanчo, obtщm-se a atenuaчуo da sobrecarga de informaчуo no momento da recuperaчуo de textos.  _ g { … јяјяјяјыhGЏhПkќ6CJaJhПkќCJaJ§ў,1hА‚. АЦA!АЅ"АЅ#‰$‰%ААФАФ Ф†œ@@ёџ@ NormalCJ_HaJmHsHtH>A@ђџЁ> Fonte parсg. padrуoTi@ѓџГT  Tabela normalі4ж l4жaі ,k@єџС, Sem listaџџџџ˜0€€  BMNW•– єџ^g|…ЖК ѓ§%/ЃЏ єќЃРх]dGЏПkќџ@€0„„@@џџUnknownџџџџџџџџџџџџG‡z €џTimes New Roman5€Symbol3& ‡z €џArial"qˆ№ФЉЛzGРzGљ љ !№Ѕ‰ДД242ƒ№KX)№џ?фџџџџџџџџџџџџџџџџџџџџџПkќ2џџфEste trabalho contribui para a сrea de recuperaчуo de informaчуo (information retrieval) que utiliza a tщcnica de agrupamento de documentos (document clustering) para apoiar a busca e recuperaчуo textos em grandes bases textuaisvivianevivianeўџр…ŸђљOhЋ‘+'Гй0L˜ˆ”ЄАМЬ мш   ,4<DфшEste trabalho contribui para a сrea de recuperaчуo de informaчуo (information retrieval) que utiliza a tщcnica de agrupamento de documentos (document clustering) para apoiar a busca e recuperaчуo textos em grandes bases textuaisvivianeNormalviviane1Microsoft Office Word@FУ#@*КрЂ2Э@p}Ѓ2ЭљўџеЭеœ.“—+,љЎ0Ь hp|„Œ” œЄЌД М ­фUFF ' хEste trabalho contribui para a сrea de recuperaчуo de informaчуo (information retrieval) que utiliza a tщcnica de agrupamento de documentos (document clustering) para apoiar a busca e recuperaчуo textos em grandes bases textuais Tэtulo ўџџџ ўџџџўџџџ !"#ўџџџ§џџџ&ўџџџўџџџўџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџRoot Entryџџџџџџџџ РFЮмЃ2Э(€1Tableџџџџџџџџ WordDocumentџџџџџџџџ.SummaryInformation(џџџџDocumentSummaryInformation8џџџџџџџџџџџџCompObjџџџџџџџџџџџџuџџџџџџџџџџџџџџџџџџџџџџџџўџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџўџ џџџџ РF#Documento do Microsoft Office Word MSWordDocWord.Document.8є9Вq