标题
  • 标题
  • 作者
  • 关键词

基于序列模式的科技文献中知识元抽取研究

2020-05-22分类号:TP391.1;G254

【作者】石义金  王忠义  沈雪莹  郑鑫  
【部门】华中师范大学信息管理学院  
【摘要】为提高科技文献中各类型知识元抽取的效率,提出一种基于序列模式的科技文献知识元抽取模型。该方法首先在各类型知识元描述规则的基础上,对知识元语句进行依存句法分析,生成融入语义的知识元序列模式;其次,基于知识元序列模式,通过模式匹配算法实现各类型知识元的抽取;最后,基于Prefixspan算法,从抽取的知识元中挖掘出新的描述知识元的序列模式,以实现知识元序列模式的不断动态更新与扩展,进而依据知识元序列模式提高知识元的抽取效率。基于序列模式的科技文献中知识元的抽取方法,克服了基于规则匹配的语义局限,具有学科延展性,提高了知识元抽取的效率。
【关键词】科技文献  序列模式  知识元  知识元抽取  依存句法  Prefixspan
【基金】华中师范大学中央高校基本科研业务费项目“数字馆藏资源多粒度层级结构挖掘研究”研究成果之一,项目编号:CCNU19TS043
【所属期刊栏目】情报理论与实践
文献传递