基于潜在语义分析和改进的HS-SVM的文本分类模型研究
2010-05-20分类号:TP391.1
【部门】武汉大学信息资源研究中心
【摘要】为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重叠区域的文本分类问题,设计一种新的决策方法—基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。
【关键词】文本分类 潜在语义分析 改进的超球支持向量机 重叠区域文本
【基金】教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目编号:08JJD870225)研究成果之一
【所属期刊栏目】图书情报工作
文献传递