标题
  • 标题
  • 作者
  • 关键词

基于概念簇的文本分类算法

2013-08-05分类号:TP391.1

【作者】马甲林  刘金岭  金春霞  
【部门】淮阴工学院计算机工程学院  
【摘要】针对传统文本分类算法在向量空间模型表示下存在向量高维、稀疏以及忽略特征语义相关性等缺陷所导致的分类效率低和精度不高的问题,以知网(HowNet)为知识库,构建语义概念向量模型SCVM(Semantic Concept Vector Model)表示文本,根据概念语义及上下文背景对同义词进行归并,对多义词进行排歧,提出基于概念簇的文本分类算法TCABCC(Text Classification Algorithm Based on the Concept of Clusters),通过改进传统KNN,用概念簇表示各个类别训练样本,使相似度的计算基于文本概念向量和类别概念簇。实验结果表明,该算法构...
【关键词】文本分类  语义概念向量  概念簇  KNN  知网
【基金】江苏省教育厅高校哲学社会科学项目“网络资源个性化信息服务模式研究”(项目编号:2012SJD870001)研究成果之一
【所属期刊栏目】图书情报工作
文献传递