标题
  • 标题
  • 作者
  • 关键词

一种基于特征词聚类的文本分类方法

2007-01-30分类号:G354

【作者】伍建军  康耀红  
【部门】海南大学信息科学技术学院  海南大学信息科学技术学院 海南海口570228  海南海口570228
【摘要】本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。
【关键词】特征词聚类  文本分类  相似度计算
【基金】
【所属期刊栏目】情报理论与实践
文献传递