标题
  • 标题
  • 作者
  • 关键词

基于语义角色标注的专利主题提取研究

2014-10-05分类号:TP391.1

【作者】孟令恩  李颖  何彦青  屈鹏  王惠临  
【部门】中国科学技术信息研究所  
【摘要】主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。
【关键词】语义角色标注  简化句  主题抽取  专利文献
【基金】国家自然科学基金项目“面向专利文献的统计机器翻译语境分析”(项目编号:61303152); 中日国际合作项目“面向科技文献的日汉双向实用型机器翻译合作研究”(项目编号:2014DFA11350)研究成果之一
【所属期刊栏目】图书情报工作
文献传递