аЯрЁБс>ўџ ')ўџџџ&џџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџьЅСq`№П;bjbjqPqP8::; џџџџџџЄЌЌЌЌЌЌЌРЈЈЈЈМ Р'жддддддддІЈЈЈЈЈЈ$§ he ЬЌдддддЬЌЌддсдњЌдЌдІдІЌЌдШ o^("еЈЮ:š ї0'u  u :u ЌVDдддддддЬЬ ддд'ддддРРРЄdDРРРdРРРЌЌЌЌЌЌџџџџ Resumo A tarefa de Semantic Role Labeling (SRL) consiste em encontrar os papщis semтnticos dos termos em uma frase de maneira automсtica. Esta щ uma tarefa essencial para a criaчуo de uma representaчуo estruturada automсtica do significado de um fragmento de texto. Um recurso linguэstico conhecido na literatura para essa tarefa щ o conjunto de documentos manualmente anotados disponэveis no Projeto FrameNet. A FrameNet щ um banco de dados lщxico legэvel por homens e mсquinas, contendo um nњmero considerсvel de sentenчas anotadas que compѕem a estrutura de frames. No entanto, enquanto vсrios frames sуo fornecidos com sentenчas anotadas, um grande grupo deles nуo possui anotaчѕes њteis. Neste trabalho, apresentamos um mщtodo de aumento de dados para os documentos da FrameNet. Esta tщcnica aumenta em mais de 13 % o nњmero total de anotaчѕes. Para tanto, nos apoiamos em aspectos lexicos, sintсticos e semтnticos das sentenчas. Avaliamos o mщtodo de aumento proposto comparando o desempenho de um mщtodo de semantic role labeling de њltima geraчуo, com e sem aumento. Palavras-chave: FrameNet, Frame SemanticParsing, SemanticRole Labeling,Aumento de Dados. Abstract Semantic Role Labeling (SRL) is the process of automatically finding the semantic roles of terms in a sentence. It is an essential task towards creating a machine-meaningful representation of textual information. One well-known supportive resource for this task is the set of manually annotated documents available in the FrameNet Project. FrameNet is a human and machine-readable lexical database containing a considerable number of annotated sentences that compose the frames structure. However, while a number of frames are provided with annotated sentences, a large group of them lacks useful annotations. In this work, we present a data augmentation method for FrameNet documents that increases by over 13% the total number of annotations. It relies on lexical, syntactic and semantic aspects of the sentences. We evaluate the proposed augmentation method by comparing the performance of a state-of-the-art semantic-role-labeling method, with and without augmentation. Keywords: Automatic Knowledge Base Construction, Frame Semantic Parsing, Frames, FrameNet, SemEval’07 task 19, Semantic Role Labeling, Statistical Relational Artificial Intelligence, StarAI, Semantic Parsing. 2 8 V ] ї  4 D … Ž  ‘ ™ š › ђ ѓ H I Ѓ Є ї ј LMžŸЂТќ§GHъиЦиЦиЦиДиŸиŸŠxŠgYgYgYgYgYgYgYgYgYhХ3žOJQJ^JnHtH hХ3žhХ3žOJQJ^JnHtH"hХ3žCJ2OJQJ^JaJ2nHtH(hХ3žhХ3žCJ2OJQJ^JaJ2nHtH(hХ3žhХ3žOJQJ^JmHnHsHtH"hХ3žOJQJ^JmHnHsHtH"hХ3žOJQJ^JmHnHsHtH"hХ3žOJQJ^JmHnHsHtH*hХ3žCJ2OJQJ^JaJ2mHnHsHtH"4 5 6   ‘ š › ij;ііъіііііііъіі $7$8$H$a$gdХ3ž 7$8$H$gdХ3ž ;§HЃЄїјNOhijrКЛ:;ясясясясяаясясяП hХ3žhУRrOJQJ^JnHtH hХ3žhХ3žOJQJ^JnHtHhХ3žOJQJ^JnHtH hХ3žhХ3žOJQJ^JnHtH61hP:p>љА|. АШA!А "А #‰$‰%ААФАФ Ф†œ˜žžžžžžžž666666666vvvvvvvvv666666>666666666666666666666666666Ј6666666666И666666666666hH66666666666666666666666666666666666666666666666666666666666666666А6H@ёџH Normal CJPJ^J_HaJmH sH tH >A@ђџЁ> 0Fonte parсg. padrуoTi@ѓџГT 0 Tabela normalі4ж l4жaі ,kєџС, 0 Sem lista ; џџџџ456‘š›ij= ˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€˜0€€j= Kˆ0€Kˆ0H; ; ; "*!’šžІ28V\xїџ FNVegst|нхяї5=ЛУ! ' = ’šžІFN= = = ќ_pYў_pY§_pYў_pY§_pYџ_pY§_pY хv0{p™$,%B^LbУRr№.†Х3žБ$Уgsѕ>љ= џ@€(Zд; @@џџUnknownџџџџџџџџџџџџGџ:рAxР џTimes New Roman5€Symbol3& џ:рCxР џArial9 SFRB24889 SFRM12009 SFTI12009 SFBX12007&џрџЌ@ŸCalibri"Aˆ№аЉ™3kGпkv‡qЪqЪ!№ ‰ДД247 7 №ќџ(№џ$Pџџџџџџџџџџџџџџџџџџџџџ{p2џџGTэtulo: Augmenting electronic semi-structured data for machine learning'Breno William Santos Rezende de CarvalhHelioўџр…ŸђљOhЋ‘+'Гй0Ь˜шє$0<L \h ˆ ”  ЌДМФфHTэtulo: Augmenting electronic semi-structured data for machine learning(Breno William Santos Rezende de CarvalhNormalHelio3Microsoft Office Word@Є“ж@ў8Ѕѕuд@J&"еqЪўџеЭеœ.“—+,љЎ00 hp|„Œ” œЄЌД М ф7 ц HTэtulo: Augmenting electronic semi-structured data for machine learning Tэtulo ўџџџўџџџўџџџ !"#$%ўџџџ§џџџ(ўџџџўџџџўџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџRoot Entryџџџџџџџџ РF Ÿc("е*€1TableџџџџџџџџWordDocumentџџџџџџџџ8SummaryInformation(џџџџDocumentSummaryInformation8џџџџџџџџџџџџCompObjџџџџџџџџџџџџuџџџџџџџџџџџџџџџџџџџџџџџџўџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџџўџ џџџџ РF#Documento do Microsoft Office Word MSWordDocWord.Document.8є9Вq