基于领域本体和概念向量的中文文本相似性测度研究
2007-11-15分类号:G354
【部门】南京理工大学经济管理学院信息管理系 南京理工大学经济管理学院信息管理系 南京理工大学经济管理学院信息管理系
【摘要】文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐。OCVSM是一种基于领域本体和概念向量相似性测度的方法。该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度。实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断。表10。图5。参考文献10。
【关键词】相似性测度 领域本体 概念向量 文本处理
【基金】总装备部“基于知识本体;数据挖掘的智能推荐关键技术与系统构建研究”项目(项目编号2006QB1066); 南京理工大学2005~2006年度青年教师科研基金研究成果。
【所属期刊栏目】中国图书馆学报
文献传递