标题
  • 标题
  • 作者
  • 关键词

三元共现潜在语义向量空间模型

2018-01-05分类号:G353.1

【作者】牛奉高  王世昌  张亚宇  
【部门】山西大学数学科学学院  
【摘要】【目的/意义】文献的向量表示方法对文献主题聚合、聚类和分类等研究具有重要意义。基于二元共现信息的潜在语义向量空间模型(CLSVSM)挖掘了文本信息中词与词之间的潜在语义关系,与文本向量表示的基本模型-向量空间模型(VSM)相比很大程度上提高了文本聚类的精度。【方法/过程】为使CLSVSM能更优的提取文献的潜在语义信息,本文在二元CLSVSM基础上进一步引入了三元共现信息,以深度挖掘文献的潜在语义,通过研究三元共现矩阵的表示,三元共现频次和相对共现强度的计算方法,最终建立了加权共现潜在语义向量空间模型(加权
【关键词】共现分析  三元共现  共现矩阵  聚类
【基金】国家自然科学基金(71503151);; 山西省高等学校创新人才支持计划(2016052006);; 山西省高校科技创新项目(2015106)
【所属期刊栏目】情报科学
文献传递