利用实体解析的跨社交媒体同一用户识别
2017-03-20分类号:G206;TP391.1
【部门】上海大学图书情报档案系
【摘要】[目的 /意义]跨领域关联实体一直是实体解析研究的主题,本文旨在不同的社交媒体(跨社交媒体)中找到属于同一用户的账户。[方法/过程]在传统近似字符串匹配技术的基础上,提出使用属性值结合社交媒体中的链接和文本内容的方法,比较两个不同社交媒体账户的属性相似度、邻域相似度和关键词相似度这三个匹配函数,以此提高识别这两个账户是否是同一个人的精确度。并利用社交媒体Facebook和Twitter数据作为实验数据集,针对匹配函数的不同组合进行试验。[结果 /结论]结果表明,三个匹配函数的组合能够得到更多的账户匹配为同
【关键词】社交媒体 实体解析 属性链接 跨社交媒体
【基金】
【所属期刊栏目】图书情报工作
文献传递