标题
  • 标题
  • 作者
  • 关键词

融合结构数据和语义的专利技术主题识别研究——以非小细胞肺癌治疗领域为例

2022-07-10分类号:G255.53;R734.2

【作者】沈漫竹  于慧娴  李倩  袁红梅  
【部门】沈阳药科大学工商管理学院  
【摘要】针对专利技术主题识别方法存在缺少语义语境、可解释性弱和主题界定模糊等问题,提出一种融合专利结构数据和文本语义的技术主题识别分析方法。该方法以专利IPC作为结构数据改进纯文本主题建模,获取由IPC和专家分类意见指导的主题词向量,并使用word2vec模型获取专利文本语义词向量,将二者结果进行向量拼接,进而获得易于解释的精准技术主题,满足细粒度分析要求。最后,以非小细胞肺癌治疗领域作为实证研究,证实该方法的科学性、有效性和实用性。
【关键词】主题模型  IPC-LDA  word2vec  向量拼接  非小细胞肺癌
【基金】沈阳药科大学工商管理学院学科建设课题“基于专利数据的制造产业技术情报分析”(2021-sygsxk-01)
【所属期刊栏目】科技管理研究
文献传递