基于特征知识元的专利语义引用识别方法研究——以量子计算领域为例
2023-04-26分类号:O413;TP391.1;G255.53
【部门】武汉大学信息系统研究中心 武汉大学信息管理学院
【摘要】[目的/意义]专利引文分析是专利分析研究的重要内容。传统专利引文分析仅分析专利文献中明确标示的物理引用专利数据不能够准确真实反映专利之间的引用关系,难以准确揭示专利之间的技术相似度。专利语义引用识别有利于准确真实揭示专利间的潜在语义联系,为专利的继承与创新评价提供参考,有助于专利授权前的专利审核和专利授权后的专利评价。[方法/过程]首先,基于规则和句法分析抽取了专利的特征知识元;其次,利用Sentence-BERT和Word2Vec对专利特征知识元及专利标题摘要文本进行向量化表示;再次,根据余弦相似度计算专利的特征相似度和整体相似度,结合专利申请日期的先后顺序得到专利的语义引用专利集;最后,采用量子计算领域专利数据进行了实验研究。[结果/结论]该专利语义引用识别方法能够实现语义引用专利的有效识别,有利于评价专利的技术新颖性、创造性和实用性,为专利审核和专利价值评估工作提供支持。
【关键词】语义引用识别 特征知识元 语义相似度 Sentence-BERT Word2Vec
【基金】国家社会科学基金重大项目“基于大数据的科教评价信息云平台构建和智能服务研究”的成果,项目编号:19ZDA349
【所属期刊栏目】情报理论与实践
文献传递