标题
  • 标题
  • 作者
  • 关键词

针对科技路线图的文本挖掘研究:信息抽取方法

2017-05-15分类号:TP391.1

【作者】谢秀芳  张晓林  
【部门】中国科学院文献情报中心  首都医科大学卫生管理与教育学院  首都医科大学图书馆  
【摘要】[目的/意义]为了加强针对科技路线图的情报研究,探索从科技路线图报告中自动抽取核心信息的方法。[方法/过程]通过分析21个国家或组织发布的166份科技路线图的内容组织和表达特征,总结科技路线图中包含的核心信息,提出一种新的信息抽取思路"抽取—同步—分类",实现对科技路线图中核心内容的抽取。[结果/结论]以45篇科技路线图报告为测试案例进行方法验证,最终获取26736条有效数据信息,按时间序列可视化呈现,能够基本反映科技路线图的主要内容,表明该方法设计可行,能够快速获取科技路线图中的核心信息,提高针对科技路
【关键词】科技路线图  文本挖掘  信息抽取  信息分类  知识发现
【基金】中国科学院规划与决策科技支持系统建设项目“科技决策知识服务平台”(项目编号:院1405);; 国家自然科学基金项目“科学结构特征及其演化动力学分析方法与应用研究”(项目编号:71173211)的成果
【所属期刊栏目】情报理论与实践
文献传递