标题
  • 标题
  • 作者
  • 关键词

基于语法树的SAO结构识别方法研究

2016-11-05分类号:G353.1

【作者】杨超  朱东华  衡晓帆  汪雪锋  
【部门】北京理工大学管理与经济学院  
【摘要】[目的/意义]SAO是一种能够表示主题信息和主题间关系的3元组结构,是文献计量学领域一个快速发展的研究方向。为了获得"满足文献计量分析需求的SAO结构",需要解决现有SAO结构识别方法遭遇的3个问题:查全和查准率低、所识别SAO结构和领域主题相关性不强以及矩阵稀疏性。[方法/过程]提出一种面向文献计量分析的基于语法树的SAO结构识别方法,首先基于共现算法和"主题词簇"方法(term clumping)识别SAO核心组件,然后利用基于语法树的抽取算法实现SAO结构的逐层抽取。[结果/结论]案例研究发现,该方法的平均查准率为0.805 8,平均查全率为0.844 6,所识别SAO结构与领域主题关系...
【关键词】“主语-行为-宾语”(SAO)识别  语法树  语义分析  共现算法  主题词簇
【基金】国家自然科学基金面上项目“基于语义TRIZ的新兴技术创新路径预测研究”(项目编号:71373019); 国家高技术研究发展计划“面向政府管理的大数据智能服务系统及应用示范”(项目编号:2014AA015105)研究成果之一
【所属期刊栏目】图书情报工作
文献传递