标题
  • 标题
  • 作者
  • 关键词

基于语义角色标注的文献相似度检测研究

2014-06-20分类号:TP391.1

【作者】王晓笛  祝娜  白如江  王效岳  
【部门】山东理工大学科技信息研究所  
【摘要】利用语义角色标注技术对文献进行标注,以句子为最小单位进行文献的语义相似度检测。提取文献中所有词语的上位词,为每篇文献形成句子-词-语义角色-上位词四部图。语义相似的句子对比参照四部图确定,最终计算出两篇文献相似句子的Jaccard系数作为两篇文献的语义相似度。实验结果表明,所识别出的语义相似度较字粒度Jaccard系数法、词粒度Jaccard系数法、Winnowing Jaccard系数法等高出13%,然而受语料库限制,本方法还有很大的提升空间。
【关键词】语义角色标注  科技文献  相似度检测
【基金】国家社会科学基金项目“学术文献‘意抄’检测研究”(项目编号:12CTQ032); 山东理工大学人文社会科学发展基金项目“Web信息检索与智能挖掘”研究成果之一
【所属期刊栏目】图书情报工作
文献传递