基于中文维基百科的领域概念相关性研究
2014-12-22分类号:G254
【部门】广东外语外贸大学思科信息学院 中山大学资讯管理学院 大连海事大学信息科学技术学院
【摘要】以提高领域概念相关性判断的准确度为研究宗旨,提出综合利用中文维基百科的分类体系结构和概念释义内容进行概念间语义相关度计算的方法。选取中文维基百科分类体系下的图书情报领域的概念为实验对象,将基于分类信息和文本信息的加权算法与单独基于分类信息的语义距离算法和信息量算法,以及基于文本信息的文本重叠算法进行对比分析。实验结果表明:加权算法能取得更好的效果,可为实现面向领域的信息检索、领域本体构建等应用提供重要技术支持。
【关键词】中文维基百科 领域概念 语义相关性 语义关系
【基金】国家社会科学基金重大项目“基于特定领域的网络资源知识组织与导航机制研究”(项目编号:12&ZD222); 教育部人文社会科学研究青年基金项目“面向轻博客热点话题情感倾向性分析的研究”(项目编号:12YJC870023)研究成果之一
【所属期刊栏目】图书情报工作
文献传递