基于SVM的中文书目自动分类及应用研究
2012-05-05分类号:TP391.1
【部门】安徽医学高等专科学校图书馆 南京大学信息管理系 宝山钢铁股份有限公司
【摘要】将文本自动分类技术应用于图书书目的自动分类中,利用ICTCLAS分词系统对书名和摘要信息进行中文分词,为标题和摘要的特征词赋予不同的权重。在构建基于文本特征矩阵的基础上,结合SVM算法对实验语料进行学习和测试。为了验证TFIDF权重对分类结果的影响,还对词频特征矩阵、TFIDF特征矩阵和混合特征矩阵进行测试和对比。实验证明,基于混合特征矩阵的SVM算法具有良好的分类效果。据此,构建基于SVM的书目自动分类系统。
【关键词】机器学习 支持向量机 自动分类 TFIDF
【基金】
【所属期刊栏目】图书情报工作
文献传递