标题
  • 标题
  • 作者
  • 关键词

共现潜在语义向量空间模型的进一步研究

2017-12-18分类号:G353.1;TP391.1

【作者】牛奉高  李星  
【部门】山西大学数学科学学院  山西大学管理与决策研究所  
【摘要】[目的/意义]文献的向量表示是文献聚类的首要任务。共现潜在语义向量空间模型(CLSVSM)通过共现分析挖掘特征词对间的最大潜在语义信息对向量空间模型(VSM)进行了语义补充,与向量空间模型相比明显提高了中文文献的聚类性能。然而,对该模型的研究还有待深入:该模型对英文文献的聚类适用性尚需检验;是否可以考虑利用除max统计量以外的其它统计量构建模型?聚类效果又会如何?面对大量的文献数据,模型的维度往往较高,运算成本大,所以有必要对模型进行优化处理。[方法/过程]首先将CLSVSM用于对英文文献集(数据来源于W
【关键词】向量空间模型  CLSVSM  TCLSVSM  共现分析  聚类
【基金】国家自然科学基金项目“共现潜在语义向量空间模型及其语义核的构建与应用研究”(编号:71503151);; 山西省高等学校创新人才支持计划“基于潜在语义的文本信息主题深度聚类研究”(编号:2016052006)的研究成果之一
【所属期刊栏目】情报杂志
文献传递