标题
  • 标题
  • 作者
  • 关键词

基于SVM的中文书目自动分类及应用研究

2012-05-05分类号:TP391.1

【作者】杨敏  谷俊  
【部门】安徽医学高等专科学校图书馆  南京大学信息管理系  宝山钢铁股份有限公司  
【摘要】将文本自动分类技术应用于图书书目的自动分类中,利用ICTCLAS分词系统对书名和摘要信息进行中文分词,为标题和摘要的特征词赋予不同的权重。在构建基于文本特征矩阵的基础上,结合SVM算法对实验语料进行学习和测试。为了验证TFIDF权重对分类结果的影响,还对词频特征矩阵、TFIDF特征矩阵和混合特征矩阵进行测试和对比。实验证明,基于混合特征矩阵的SVM算法具有良好的分类效果。据此,构建基于SVM的书目自动分类系统。
【关键词】机器学习  支持向量机  自动分类  TFIDF
【基金】
【所属期刊栏目】图书情报工作
文献传递