基于样本加权的引文网络的社团划分
2016-10-20分类号:G353.1
【部门】中国科学院大学 中国科学院成都文献情报中心 中国科学院计算技术研究所
【摘要】[目的 /意义]为提高引文网络的社团划分的准确性,提出一种基于加权的引文网络的社团划分方法。[方法/过程]以Louvain社团划分方法为算法基础,将科学论文用向量空间模型表示,利用改进的余弦相似度方法计算相邻论文之间的相似度,并将其作为权重,综合考虑论文内容属性与结构属性,提出一种基于样本加权的引文网络社团划分方法。[结果 /结论]该算法将引文网络中论文的文本内容属性与拓扑结构属性结合起来,通过对ScientometricS期刊发表的论文以及主题为criSPr的论文进行社团划分研究实验,结果表明该方法能改善引文网络社团的划分效果。
【关键词】引文网络 社团划分 聚类 文本挖掘
【基金】国家高技术研究发展计划(“863”计划)“微生物数字资源知识管理系统构建及关键技术研究”(项目编号:2014AA021503); 中国科学院2013年度“西部之光”人才培养计划“引文耦合网络演化分析及在科技评价与预测中的应用研究”(项目编号:科发人字〔2013〕165号(3-6))研究成果之一
【所属期刊栏目】图书情报工作
文献传递