标题
  • 标题
  • 作者
  • 关键词

面向学术全文本多维知识元的学术图谱构建研究

2024-08-24分类号:G353.1

【作者】沈思   朱雨菲
【部门】南京理工大学经济管理学院  中国国际经济交流中心  
【摘要】学术全文本中包含了多种知识元,对这些知识元进行挖掘与组织,可以有效提升学术资源的利用效率。通过学术知识图谱的构建,将论文中各类隐性“知识元”串联起来,不但可以节省研究者获取知识点的时间,还可以通过知识图谱内的网络社区进行知识点的扩充。通过系统而全面的文献调研,本文从宏观、中观和微观3个维度出发,确定了18种学术论文中的关键知识元,并将学术全文本中的描述信息作为知识元对象,设计出学术知识图谱概念框架。然后,选取Journal of the Association for Information Science and Technology (JASIST)期刊的515篇学术全文本,对每篇论文中的关键知识元进行人工标注与基于深度学习的知识元抽取研究。研究内容包括该类知识元在人工标注过程中是否会遇到问题、在自动抽取时是否会达到预期值,从而对参与图谱构建的知识元进行筛选。最终筛选出9种知识元,包括数学公式、软件工具、数据源、具体模型、表、图、研究展望、研究问题和研究结果,与题录数据中的知识元共同生成由头知识元、关系、尾知识元组成的三元组,存入图数据库。最后,对该图谱进行可视化的评估与知识元检索研究,证明了其可行性与可扩展性。研究结果表明,学术全文本中的部分知识元适合大规模的自动化标注,而且各类知识元可以通过互相链接形成密集的知识社区,并具备知识元搜索等功能。
【关键词】知识元  知识图谱  学术全文本  深度学习
【基金】国家自然科学基金面上项目“基于深度学习的学术全文本知识图谱构建及检索研究”(71974094);; 江苏省研究生科研与实践创新计划项目“基于知识元的学术全文本实体和关系抽取研究”(KYCX21_0423)
【所属期刊栏目】情报学报
文献传递