基于误分类修正的朴素贝叶斯分类器及其在政务热线行业分类中的应用
2023-12-15分类号:TP181;D630
【部门】东北师范大学经济与管理学院 东北师范大学数学与统计学院应用统计教育部重点实验室
【摘要】传统统计分类方法应用于政务热线行业文本分类问题时存在一定系统性偏差。为了修正系统性偏差,进而减少由误分类导致的额外人力和时间成本,本文将朴素贝叶斯模型作为基准分类器,在最大后验概率判别准则中引入修正系数,并基于验证集上的误分类结果对修正系数进行学习,将其应用于政务热线的行业文本分类中。实证结果表明,修正后分类器的分类精确度比基准分类器提升了至少1个百分点,使误分类样本量减少了4个百分点。由于政务热线的文本工单数量庞大,故该方法对提升行政服务效率,降低人力资源成本具有积极意义。
【关键词】朴素贝叶斯 政务热线 文本分类 修正系数
【基金】国家社会科学基金(19CTJ013)
【所属期刊栏目】数理统计与管理
文献传递