综合位置和语义权重的专利文本向量表示方法
2017-04-14分类号:TP391.1;G306
【部门】江苏大学科技信息研究所 江苏大学科学技术与产业处
【摘要】[目的/意义]专利文献包含着丰富的创新知识信息,是一种重要的知识载体。世界各国专利文献均有统一的内容编排体例,具有专利文献自身的用词特点。[方法/过程]通过构建领域专利知识库,用于计算专利文本词项的专利语义权重,具体过程为:假设两待比对的专利文本为和,首先通过词包法将其表示成实词向量;然后通过构建的领域专利知识库赋以各词项专利语义权重,进一步表示成带有专利语义信息的向量;再结合TF-IDF规则,最后将专利文本表示成带有专利语义权重信息以及词频权重信息的文本向量和。[结果/结论]研究为构建领域专利知识库提供
【关键词】专利文献 专利文本向量 语义表示 领域专利知识库
【基金】国家自然科学基金青年项目“专利文献的要素组合拓朴结构及向量空间语义表示与相似度计算研究”(项目编号:71403107);; 教育部人文社会科学研究青年基金项目“基于新核函数的相似专利文献检索研究”(项目编号:13YJC870026)和教育部人文社会科学研究青年基金项目“基于需求导向的高校专利转化商业模式选择研究”(项目编号:13YJC630063)的成果之一
【所属期刊栏目】情报理论与实践
文献传递