标题
  • 标题
  • 作者
  • 关键词

基于词向量包的自动文摘方法

2017-02-15分类号:TP391.1

【作者】白淑霞  鲍玉来  张晖  
【部门】内蒙古大学图书馆  内蒙古大学计算机学院  
【摘要】[目的]利用向量空间描述语义信息,研究基于词向量包的自动文摘方法;[方法]文摘是文献内容缩短的精确表达;而词向量包可以在同一个向量空间下表示词、短语、句子、段落和篇章,其空间距离用于反映语义相似度。提出一种基于词向量包的自动文摘方法,用词向量包的表示距离衡量句子与整篇文献的语义相似度,将与文献语义相似的句子抽取出来最终形成文摘;[结果]在DUC01数据集上,实验结果表明,该方法能够生成高质量的文摘,结果明显优于其它方法;[结论]实验证明该方法明显提升了自动文摘的性能。
【关键词】词向量  词包向量  自动文摘
【基金】国家自然基金项目“基于领域本体的蒙古文数字资源整合机制研究”(项目编号:71163029)
【所属期刊栏目】现代情报
文献传递