基于权重的朴素贝叶斯分类器设计与实现
2008-05-30分类号:TP18
【部门】西南科技大学信息学院 西南科技大学信息学院 西南科技大学信息学院 西南科技大学信息学院 四川绵阳621010 四川绵阳621010 中国工程物理研究院 四川绵阳621900 四川绵阳621010 四川绵阳621010
【摘要】贝叶斯分类器可以归结为求词条的先验概率,目前分类器中普遍使用词条的文档出现次数和词频来计算先验概率。本文提出了一种基于权重的朴素贝叶斯分类器,不仅改进了文本中词条的先验概率计算方式,并增加了词条的权重对计算的影响。该分类器使用TFIDF模型及其改进算法实现了分类器的设计。实验结果表明,该分类器的效果比传统算法有较大的改进。
【关键词】文本分类 朴素贝叶斯分类器 算法
【基金】国家自然科学基金(项目编号:60272014); 国家“863”计划项目(项目编号:2005AA121520); 西南科技大学重点科研基金项目(项目编号:06zx2130)研究成果之一
【所属期刊栏目】情报理论与实践
文献传递