标题
  • 标题
  • 作者
  • 关键词

基于中文学术文献的领域本体概念层次关系抽取研究

2020-04-24分类号:TP391.1;TP18

【作者】唐琳  郭崇慧  陈静锋  孙磊磊  
【部门】大连理工大学系统工程研究所  北京航空航天大学软件开发环境国家重点实验室  
【摘要】基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
【关键词】概念层次关系  本体构建  学术文献  深度学习  时间序列
【基金】国家自然科学基金项目“电子病历挖掘中的聚类模型与算法研究”(71771034);; 揭阳市科技计划项目“大数据驱动的中药材产业发展决策支持系统”(2017xm041)
【所属期刊栏目】情报学报
文献传递