基于支持向量机的医学期刊文章自动分类研究
2011-04-30分类号:G354
【部门】南京大学信息管理系信息技术开发研究所 方正集团技术研发部
【摘要】基于支持向量机学习模型,使用万方期刊数据库中医学、卫生的有关标题和摘要数据,对医学、卫生大类下的R7中的9个小类进行了自动分类研究。在中文信息处理知识和技术的基础上选取分类特征,在分类过程中主要采取了基于低密度多特征的训练方法。在互信息、卡方统计、交叉熵和证据权值4个不同的统计特征量的开放测试中,自动分类的查全率和准确率都取得了相对令人满意的结果。
【关键词】支持向量机 期刊 自动分类
【基金】教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”的研究成果之一,项目批准号:08JJD870225
【所属期刊栏目】情报理论与实践
文献传递