标题
  • 标题
  • 作者
  • 关键词

基于内容相似性的科技论文网络的构建及其属性的初步分析

2014-03-30分类号:TP391.1

【作者】潘现伟  杨颖  崔雷  
【部门】中国医科大学医学信息学系  中国医科大学图书馆  
【摘要】构建基于内容相似性的科技论文网络,并对其属性进行初步分析。在Pubmed数据库中检索数据挖掘主题的文献记录,利用在线概念抽取软件Metamap对文献集进行概念抽取,统计各个概念出现的频次,采用TF-IDF算法计算每个词的权重,形成论文—概念权重矩阵,计算每两篇论文所有概念的内积最终构建出论文相似性矩阵,并对相似矩阵的有效性进行了人工初步评判。利用社会网络分析软件Ucinet可视化表达论文相似性矩阵,并对论文网络的属性进行了初步分析。通过这种方法构建出了基于内容相似性的科技论文可视化网络,该网络是一个松散型网络,具有复杂网络的"小世界"特性,并具有鲁棒性和脆弱性。本研究表明,根据内容的相似性构建...
【关键词】内容相似性  科技论文  复杂网络  权重  网络构建
【基金】
【所属期刊栏目】情报理论与实践
文献传递