基于引文内容分析的引用情感识别研究
2018-08-05分类号:G353.1
【部门】山东理工大学科技信息研究所 中国科学院成都文献情报中心 中国科学院大学
【摘要】[目的 /意义]针对自动识别论文引用情感问题,提出一种基于引文内容分析的识别方法并进行可视化展示,克服基于简单引用频次计量无法区分不同引用情感的问题。[方法 /过程]首先,利用正则表达式抽取出论文全文中的引文内容信息;然后,利用TF-IDF算法筛选出引用情感特征词,结合情感词典,利用情感分析技术对引文内容进行引用情感识别;最后,利用可视化工具展示出引用情感整体分布情况。[结果 /结论]该方法能够有效识别出抗衰老领域论文数据集中引用情感情况。实验结果显示,该领域正面引用占总引用次数的21%,中立引用占总引用次数的78%,负面引用仅占总引用次数的1%。与传统引文网络相比较,基于引用情感的可视化图谱可以有效识别出不同引用情感在整体数据集合上的分布情况。
【关键词】引文内容分析 引用情感 情感分析 可视化
【基金】教育部人文社会科学研究青年基金项目“基于引文内容分析的科技创新路径识别研究”(项目编号:16YJC870008);; 山东理工大学高等教育研究项目(项目编号:2018GJY08)研究成果之一
【所属期刊栏目】图书情报工作
文献传递