GMAP:一种基于AP聚类的共词分析方法
2017-11-24分类号:G353.1
【部门】大连理工大学系统工程研究所 软件架构国家重点实验室(东软集团)
【摘要】文献计量学领域中的共词分析方法主要分为三个阶段:术语收集阶段、共现频率统计阶段以及聚类分析阶段,传统共词分析方法在以上三个阶段存在主观性过强、信息量不足,聚类不稳定、成员划分不合理、类团解释缺少语义分析等问题,导致了领域主题发现容易存在偏差。本文针对传统共词分析方法存在的缺陷提出了一种新的共词分析方法——GMAP共词分析方法,即将g指数、互信息概念以及AP聚类算法融入共词分析方法中。首先,使用g指数确定高频关键词的个数;其次,使用互信息概念对共现矩阵进行包容化处理;最后,使用AP算法进行聚类得出领域主题。
【关键词】共词分析 g指数 互信息 AP聚类
【基金】国家自然科学基金(71171030,71421001);; 文化产业发展专项资金资助项目(教财司预函[2013]228号);; 软件架构国家重点实验室开放课题基金(SKLSAOP1703)
【所属期刊栏目】情报学报
文献传递