标题
  • 标题
  • 作者
  • 关键词

专利文献的结构树模型及其在相似度计算中的应用

2015-03-13分类号:G306;TP391.1

【作者】王秀红  袁艳  赵志程  李洁玉  刘海军  杨国立  
【部门】江苏大学科技信息研究所  中石油昆仑燃气有限公司  
【摘要】文章除了考虑专利文献的名称、摘要、权利要求书和说明书4要素之外,还结合考虑主分类号和引文信息,构建6要素的专利文献结构树:依据专利文献各要素的特点,建立结构树的根节点、父子节点和叶子节点的关系。实验结果表明:将该结构树结构应用于专利文献相似度计算,与不考虑主分类号和引文的4要素加权方法相比,精准率、召回率和F1指标分别提高了22.31%、14.53%和20.30%;与将专利文献作为一个整体向量直接进行相似计算方法相比,精准率、召回率和F1指标分别提高了79.26%、51.93%和72.63%,大大提高了专利相似度计算的效果。
【关键词】专利文献  相似度  信息检索  专利检索
【基金】教育部人文社会科学基金青年项目“基于新核函数的相似专利文献检索研究”(项目编号:13YJC870026); 国家自然科学基金青年项目“专利文献的要素组合拓扑结构及向量空间语义表示与相似度计算研究”(项目编号:71403107); 中国博士后第七批特别资助基金项目“综合位置;语义的专利文献核函数构造及相似度计算研究”(项目编号:2014T70491)的成果之一
【所属期刊栏目】情报理论与实践
文献传递