基于语法树的SAO结构识别方法研究
2016-11-05分类号:G353.1
【部门】北京理工大学管理与经济学院
【摘要】[目的/意义]SAO是一种能够表示主题信息和主题间关系的3元组结构,是文献计量学领域一个快速发展的研究方向。为了获得"满足文献计量分析需求的SAO结构",需要解决现有SAO结构识别方法遭遇的3个问题:查全和查准率低、所识别SAO结构和领域主题相关性不强以及矩阵稀疏性。[方法/过程]提出一种面向文献计量分析的基于语法树的SAO结构识别方法,首先基于共现算法和"主题词簇"方法(term clumping)识别SAO核心组件,然后利用基于语法树的抽取算法实现SAO结构的逐层抽取。[结果/结论]案例研究发现,该方法的平均查准率为0.805 8,平均查全率为0.844 6,所识别SAO结构与领域主题关系...
【关键词】“主语-行为-宾语”(SAO)识别 语法树 语义分析 共现算法 主题词簇
【基金】国家自然科学基金面上项目“基于语义TRIZ的新兴技术创新路径预测研究”(项目编号:71373019); 国家高技术研究发展计划“面向政府管理的大数据智能服务系统及应用示范”(项目编号:2014AA015105)研究成果之一
【所属期刊栏目】图书情报工作
文献传递