基于粒子群的模糊C均值文本聚类算法研究
2010-03-20分类号:TP391.1
【部门】华中师范大学信息管理系 南京大学信息管理系
【摘要】利用模糊C均值算法解决文本聚类问题时,随机选取的初始聚类中心和聚类数会导致不同的聚类结果,且容易陷入局部最优。提出利用粒子群优化算法确定模糊C均值的初始聚类中心,并通过向量空间模型和特征提取,再利用模糊C均值进行文档聚类。实验表明,这种基于粒子群的模糊C均值聚类算法迭代次数少,能解决经典模糊C均值算法对初始值敏感和易陷入局部极小的缺点,且聚类速度和效果得到明显提高。
【关键词】模糊C均值 粒子群 文本聚类
【基金】
【所属期刊栏目】图书情报工作
文献传递