基于关联规则的Wikidata人物名称数据分析——以诺贝尔文学奖得主为主题
2017-09-21分类号:TP311.13
【部门】山西大学经济与管理学院
【摘要】[目的 /意义]挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程]提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果 /结论]分析右部为地点名称、机构名称、时间名
【关键词】名称数据 关联规则 Apriori算法 知识揭示 Wikidata
【基金】国家社会科学基金重点项目“基于关联数据的中文名称规范档语义描述及数据聚合研究”(项目编号:15ATQ004)研究成果之一
【所属期刊栏目】图书情报工作
文献传递