学术文献引文上下文自动识别研究
2016-10-10分类号:G350
【部门】武汉大学信息管理学院 武汉大学信息检索与知识挖掘研究所
【摘要】[目的 /意义]引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。[方法 /过程]梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。[结果 /结论]实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。
【关键词】引文上下文 引文内容分析 支持向量机 条件随机场 隐式上下文
【基金】国家自然科学基金面上项目“面向词汇功能的学术文本语义识别与知识图谱构建”(项目编号:71473183)研究成果之一
【所属期刊栏目】图书情报工作
文献传递