基于多源文本挖掘的技术演化路径识别
2022-07-15分类号:TP391.1
【部门】华中科技大学机械科学与工程学院 清华大学公共管理学院
【摘要】[目的/意义]提出一种基于文档向量化和自动化短语挖掘的改进主题建模方法(Doc2Vec-KMeans++-TopMine, DKT),从多维视角识别领域内的技术演化路径,展示领域内技术的发展与现状。[方法/过程]获取研究领域内的论文、专利、产品等多源数据,综合采用文档向量化、聚类算法和短语挖掘算法,完成领域多源数据的融合主题挖掘,通过语义相似度计算进行多源融合主题的关联与演化路径的识别,采用“主题河流图”可视化方法绘制多维度技术演化路径,从前沿研究、技术研发、市场应用等多维度视角出发开展领域演化分析。[结果/结论]选取数控机床领域进行实证研究,实验结果表明,利用DKT方法挖掘到的演化路径信息丰富,可以进行多维技术演化路径分析,并证明了其有效性,同时还得到了多个维度视角下的领域发展过程,发现了数控机床领域的3种技术演化模式。
【关键词】技术演化路径 多源数据 主题建模 文本挖掘 Doc2Vec TopMine
【基金】国家自然科学基金项目“面向2035的高档数控机床技术路线图研究”的成果,项目编号:L1824043
【所属期刊栏目】情报理论与实践
文献传递