主题对比视域下的科学前沿识别方法研究——以碳纳米管领域为例
2019-01-14分类号:G353.1;TQ127.11;TB383.1
【部门】山东理工大学科技信息研究所
【摘要】[目的/意义]以两种科技文本数据(科技规划文本和基金项目数据)为数据源,构建主题对比视域下的科学前沿识别方法,以期识别出碳纳米管领域科学前沿。[方法/过程]首先,获取碳纳米管领域科技规划文本和基金项目数据,面向科技规划文本提出了一种以触发词库为基础的规则匹配抽取研究主题的研究方法;面向基金项目数据利用主题模型对其进行研究主题识别;通过计算余弦相似度的方法对比研究主题,结合项目数、资助时长、资助强度等指标构建科学前沿识别模型,并对科学前沿的研究价值与意义进行综合评价。[结果/结论]实验结果表明该方法可以更有效地识别出科学研究前沿主题,科技规划文本的识别粒度为句子级,相比以词为最小识别单位的识别,结果较为宏观。
【关键词】科学研究前沿 主题识别 信息抽取 多源数据
【基金】国家社会科学基金项目“未来新兴科学研究前沿识别研究”的成果,项目编号:16BTQ083
【所属期刊栏目】情报理论与实践
文献传递