基于Chunk-LDAvis的核心技术主题识别方法研究
2019-05-05分类号:G254
【部门】中国科学院成都文献情报中心 中国科学院大学经济与管理学院图书情报与档案管理系 中国科学技术信息研究所 中国人民大学信息资源管理学院
【摘要】[目的/意义]基于大量专利文献数据的核心技术主题识别有助于识别某技术领域的关键技术、分析关键技术的发展方向,是进行技术创新的基础情报工作,对于研究人员、企业乃至国家层面都具有一定的意义。[方法/过程]提出基于Chunk-LDAvis的核心技术主题识别方法,首先基于经典LDA模型进行主题识别,然后利用名词组块对初始LDA主题识别结果进行标注,构建Chunk-LDA主题识别结果,提高其可解读性;然后基于社会网络分析方法构建主题网络,识别核心技术主题;基于R语言的LDAvis工具包绘制可交互的Chunk-LDAvis核心技术主题关联分析图谱,发现核心技术主题的隐含联系,辅助进行核心技术主题识别。[结果/结论]通过对纳米农业领域进行实证研究,验证了本文提出方法的准确性和可行性。
【关键词】Chunk-LDAvis 专利分析 主题识别 核心技术主题 交互可视化
【基金】国家自然科学基金项目“基于科学—技术主题关联分析的创新演化路径识别方法研究”(项目编号:71704170);; 中国科学院成都文献情报中心青年人才创新项目(项目编号:Y7Z0581002)研究成果之一
【所属期刊栏目】图书情报工作
文献传递