基于词袋模型的关联数据融合算法改进研究
2016-11-02分类号:TP391.1
【部门】上海财经大学 上海外国语大学图书馆
【摘要】词袋模型是一种最原始且普遍适用的关联数据融合算法,但是该算法中关键词匹配未利用自身语义以及语料库不足等现象,造成实体链接准确率不高。本文提出使用知识库作为背景,利用语义扩展和循环迭代来增强实体消歧的速度和准确率。该算法分为两个过程,首先对关联数据集进行初步的语义融合,然后在此基础上,利用本文提出的语义循环迭代词袋(s-i-Bo W)算法实现实体的消歧与链接。实验通过与基于传统词袋算法的关联数据融合进行了对比,证明了本文提出的语义循环迭代词袋算法具备更优的关联数据融合效果。
【关键词】词袋模型 BoW 关联数据融合 实体链接 实体消歧
【基金】
【所属期刊栏目】图书馆杂志
文献传递