基于概念向量的文本语义相似度方法探索
2017-06-25分类号:TP391.1
【部门】中国科学院文献情报中心 中国科学院成都文献情报中心
【摘要】在对概念语义相似度方法调研的基础上,本文提出基于概念向量的文本语义相似度测度方法,借助MetaMap工具抽取文本中的概念术语,将概念术语通过词表层级结构转化为概念向量,通过计算两文本中概念向量的语义相似度来测度两文本的语义相似度。为验证基于概念向量文本语义相似度方法的准确性,选取TREC-05 genomics track数据进行实验,实验结果表明,本文提出的方法较常用的余弦方法更优,与专家评估方法更接近,在测度文本语义相似度上具有一定的可行性和有效性。
【关键词】概念向量 语义相似度 文本相似度
【基金】ISTIC-EBSCO文献大数据发现服务联合实验室基金项目“基于clique子团聚类的文本主题识别方法研究”资助
【所属期刊栏目】数字图书馆论坛
文献传递