基于异构图书评论信息融合模型的超图聚类研究
2024-09-23分类号:TP391.1;TP311.13
【部门】吉林大学商学与管理学院
【摘要】[目的/意义]图书评论中的异构信息包含多种数据结构和复杂高阶关系,而现有聚类方法主要是针对单一数据结构和成对关系的数据分类,为了充分挖掘现实世界中实体间的高阶交互关系,提升异构信息和高维数据集的聚类效果及可靠性,提出了基于异构图书评论信息融合模型(UB-TRR)的超图聚类方法。[方法/过程]以阅读分享社区中的图书评论数据集为基础,抽取图书和用户两类节点,梳理文本评论、评分评级和标签标注三种用户行为中的异构信息并抽取节点间的4类高阶交互关系作为超边,构建超图实现异构数据和高阶关系的融合表示,结合超图随机游走与谱聚类分别实现图书及用户节点的聚类分析,并在“豆瓣读书”数据集中进行模型实验。[结果/结论]实验结果表明,融合异构信息捕捉高阶关系后的超图聚类性能优于基线模型,具有良好的聚类效果和稳定性,为高维数据聚类方法的改进和优化提供了新的视角。
【关键词】异构信息 图书评论 数据融合 高阶关系 超图聚类
【基金】国家自然科学基金面上项目“基于图模型的多源异构在线产品评论数据融合与知识发现研究”的成果,项目编号:71974075
【所属期刊栏目】情报理论与实践
文献传递