标题
  • 标题
  • 作者
  • 关键词

基于知识元的中文文本层级分割

2019-04-05分类号:G254

【作者】王忠义  沈雪莹  黄京  
【部门】华中师范大学信息管理学院  武汉职业技术学院  
【摘要】[目的/意义]为帮助用户检索到完整的、粒度大小适当的知识单元,满足用户多粒度的知识需求。[方法/过程]提出一种基于知识元的文本层级分割方法。该方法首先对知识元的类型及其描述规则进行分析;然后依据知识元描述规则识别实体资源中的各类型知识元,并将所有的知识元和知识元之间的衔接句视为一个类;最后基于fisher分割算法对该类进行逐级二分,直到识别出所有的主题为止,确定分割边界,实现文本层级分割。[结果/结论]基于知识元的中文文本层级分割方法,一方面使得文本分割单元从句子扩展为知识元,提高分割时的效率,另一方面将知识服务的控制单元从文献深入到以知识元、知识元集合为单位的知识块,按需为用户提供相关知识服务,使数据检索、信息检索向知识检索迈进,提高知识获取效率,实现信息服务向知识服务的转型。
【关键词】知识元识别  聚类  层级分割
【基金】教育部人文社会科学研究青年基金“数字图书馆馆藏资源多粒度层级主题分割研究”(项目编号:16YJC870003)研究成果之一
【所属期刊栏目】图书情报工作
文献传递