基于词表的分类向量空间模型在中文科技文献相关性判定中的应用研究
2016-10-21分类号:G353.1
【部门】重庆建筑工程职业学院 重庆第二师范学院 重庆维普资讯有限公司
【摘要】探讨相关文献三种实现机制的特点,构建更有效的中文科技文献相关性数据库。借鉴完全内容特征算法,基于词表的分类向量空间模型进行预处理相关文献,并以冶金工业领域为例构建中文科技文献相关性数据库。通过结合系统判定和人工判定结果的对比分析、系统和系统之间的判定结果的对比,分析了基于词表的分类向量空间模型的相关性判定效果,结果表明其具有较高的准确率。基于完全内容特征算法判定相关文献有利于完善知识发现系统功能,提高知识服务水平。
【关键词】分类向量空间模型 分类-SIM 词表分词 相关性判定 相关文献
【基金】
【所属期刊栏目】图书馆杂志
文献传递