面向专利技术主题分析的WI-LDA模型研究
2018-09-05分类号:G255.53
【部门】山东理工大学科技信息研究所
【摘要】[目的/意义]改善现有LDA专利技术主题分析存在的辨识度低、可解释性弱和界限划分模糊问题,对于把握技术热点、追踪技术前沿具有重要意义。[方法/过程]将国际分类号IPC引入LDA专利主题分析中,将其作为技术词的语境,以二元组的WI(Word IPC)结构进行训练,构建WI-LDA模型,实现对专利文献主题的识别和分析。[结果/结论]通过中国石墨烯领域的实证研究及与传统LDA模型的对比研究证明,WI-LDA模型泛化能力较强,在专利技术主题分析上能有效降低主题的辨识难度,增加主题的可解释性,使文本主题划分更加清晰。
【关键词】WI-LDA 主题模型 专利技术主题 石墨烯
【基金】国家社会科学基金项目“高校图书馆深度嵌入专利运营研究”(项目编号:16BTQ029)研究成果之一
【所属期刊栏目】图书情报工作
文献传递