融合用户兴趣和混合估计的微博检索模型
2019-04-24分类号:G354
【部门】河北大学管理学院 天津大学管理与经济学部 中央司法警官学院信息管理系
【摘要】随着移动互联技术的进一步发展,微博检索已成为微博服务的重要组成部分。考虑到微博检索与传统文本检索的不同,提出一个改进的微博检索模型。新模型对传统查询似然模型中的文档先验概率和文档语言模型估计进行了改进。在文档先验概率方面,通过量化用户对博文的兴趣获得用户的兴趣博文库,并在兴趣博文库的基础上计算微博先验概率,使得符合检索用户兴趣的微博具有较高的先验概率;在文档语言模型估计方面,混合内容及用户交互两方面信息获得微博的相关文档集,并将其作为平滑项实现对微博文档语言模型的混合估计,有效缓解了微博短文本的数据稀疏问题。实验采用从新浪微博爬取的真实数据对研究内容的有效性进行验证,结果表明与现有研究中较好的改进查询似然模型相比,新模型在P@15、P@30和MRR上均有一定提高。
【关键词】微博检索 查询似然模型 用户兴趣 用户交互 混合估计
【基金】国家社会科学基金面上项目“网络信息治理视域下社交网络不可信用户识别研究”(17BTQ068)
【所属期刊栏目】情报学报
文献传递