标题
  • 标题
  • 作者
  • 关键词

基于语义文本图的论文摘要关键词抽取算法

2021-08-24分类号:TP391.1

【作者】王晓宇  王芳  
【部门】东北财经大学管理科学与工程学院信息管理系  南开大学商学院信息资源管理系  
【摘要】鉴于关键词对大规模文献检索和文本内容分析的基础作用,本文提出了一种基于语义文本图的无监督关键词抽取算法,重点对传统基于图(graph-based)方法中的文本图构建和词加权方式进行改进。为了使文本图保留更多的语义和结构信息,算法根据单词在句子中的语义依存关系,生成由概念连接、等价隶属、功能属性和修饰限定四种属性边构成的语义文本图,省去传统图生成方法中所需要的窗口长度参数设定。在此基础上,本文提出融合关键词位置信息、概念层级和连接强度的词权重计算方法,并对词语的重要性排序,最终选择高得分节点构成摘要文本的关键词集合。在四个开放语料上的实验结果显示,本文提出的方法抽词效果优于其他三个同类baseline算法,F1值最高为0.570。
【关键词】文本图  关键词抽取  词加权  句法解析
【基金】国家社会科学基金重大项目“基于数据共享与知识复用的数字政府智能化治理研究”(20ZDA039)
【所属期刊栏目】情报学报
文献传递