标题
  • 标题
  • 作者
  • 关键词

基于CTM模型与K-means算法融合的文本聚类研究

2017-11-30分类号:G254

【作者】宋凯  李秀霞  赵思喆  
【部门】曲阜师范大学传媒学院  
【摘要】[目的/意义]针对CTM模型与K-means算法在文本聚类中存在的不足,提出将二者融合的CKM算法。该算法利用CTM模型确定聚类数和初始聚类中心,利用K-means算法进行聚类。[方法/过程]以Web of Science为数据来源,建立涵盖6个主题的多学科文献集,以F值为评价指标,利用R语言中的k-means函数和topicmodels包,比较K-means算法、CTM模型、CKM算法的聚类效果。[结果 /结论]结果表明,与单纯使用K-means算法、CTM模型相比,CKM算法的聚类效果更优,稳定性更好
【关键词】K-means算法  CTM模型  融合  文本聚类
【基金】国家社会科学基金项目“文献内容分析与引文分析融合的知识挖掘与发现研究”的成果,项目编号:16BTQ074
【所属期刊栏目】情报理论与实践
文献传递