一种基于特征的实体统一算法在数据集成中的应用研究
2015-07-15分类号:TP311.13;G250.74
【部门】中国国防科技信息中心
【摘要】实体统一对于提高数据的简洁性和准确性具有重要意义。在Web数据集成领域,实体统一是被广泛关注的重点研究方向。文章基于朴素的成对匹配实体统一算法,提出一种新的基于特征的增量式实体统一方法,通过对实体特征的有效区分并定义新的数据结构,提升了算法的准确率,降低了算法时间复杂度,并应用于DBLP论文数据库,结果证明该方法可以有效提升Web数据集成的数据质量。
【关键词】实体统一 特征 领域数据 应用研究
【基金】
【所属期刊栏目】情报理论与实践
文献传递