面向关联数据的实体链接发现方法研究
2016-11-15分类号:TP311.13
【部门】华中师范大学信息管理学院
【摘要】随着关联数据应用的不断深入,已有众多的数据集发布在网上,但目前已发布的关联数据集之间关联很少,为数据的共享使用带来不便。本研究提出一种基于统计学习方法进行关联数据集间实体识别及链接构建的方法。首先进行数据集间的实体匹配,采用基于K中心点聚类算法实现属性的聚合及关系发现,对具有高相关度的属性进行匹配关系描述,降低实体匹配时的属性匹配计算次数;其次对已匹配的属性进行实体属性值的相似度比较计算,实现实体间相似度的比较,在SILK框架下实现实体的链接构建工作,以达到实体链接发现的目的;最后通过实验验证,这一方法能降低数据集间实体匹配计算次数,提高实体链接的正确率,具有可行性及实用性。
【关键词】关联数据 实体链接 数据链接 链接发现
【基金】国家社会科学基金一般项目“基于关联数据的知识创造中知识外化和融合机制研究”(编号:12BTQ039)的研究成果之一~~
【所属期刊栏目】中国图书馆学报
文献传递