标题
  • 标题
  • 作者
  • 关键词

融合兴趣主题矩阵和主题生命树的社交用户长短兴趣挖掘

2023-10-13分类号:TP391.1

【作者】吴树芳   高梦蛟   朱杰
【部门】河北大学管理学院  河北大学数学与信息科学学院  
【摘要】[目的/意义]针对当前社交用户兴趣挖掘效果不理想,且缺乏对兴趣类型特征的深入研究,提出一种新的长短兴趣挖掘方法。[方法/过程]首先引入兴趣价值参数作为先验知识对Labeled LDA主题模型进行改进,依据改进的主题模型挖掘不同时间窗口的兴趣主题,构建兴趣主题矩阵。然后基于用户兴趣的变化规律构建主题生命树,挖掘用户兴趣的生命特征和潜在关联,将用户兴趣划分为长期兴趣、短期兴趣和过期兴趣。最后依据兴趣主题的强度和波动幅度量化用户不同类型兴趣的权重,实现对用户兴趣的准确表示。[结果/结论]实验采用从新浪微博爬取的真实数据作为训练集和测试集,与已有的兴趣挖掘方法进行比较,结果发现长短兴趣挖掘方法在F1值和MRR值上最高分别提升了7.68%和7.41%。[局限]仅利用微博文本信息对方法进行验证,缺乏对跨平台信息的深入探讨。
【关键词】兴趣挖掘  长短兴趣  主题模型  兴趣主题矩阵  主题生命树
【基金】河北省人文社会科学研究重大课题攻关项目“基于大数据的河北省网络治理机制研究”(项目编号:ZD202102);; 河北省自然科学基金项目“基于语义结构的自适应图卷积跨模态特征学习方法研究”(项目编号:F2022511001);; 河北大学哲学社会科学重大培育项目“网络生态驱动下谣言传播及阻断机制研究”(编号:2021HPY004)的成果
【所属期刊栏目】情报理论与实践
文献传递