面向语义关联的微博信息多维主题聚合研究
2018-07-30分类号:G206;G353.1
【部门】福州大学经济与管理学院
【摘要】社交媒体的兴起极大地改变了网络用户的信息行为习惯,人们在惊叹信息获取方式便捷、高效、丰富的同时也被社交媒体信息缺乏组织、良莠不齐、检索困难等问题所困扰。与传统的文献型知识体系构成相区别,社交媒体信息的海量化与主题发散性特征尤其明显。文章以新浪微博为例,从微博短文本的内容、时间、空间、人物等多维度实现面向语义关联的多维度主题聚合。从内容特征上,针对微博短文本数据的稀疏特性,选取适用于短文本挖掘的LDA主题模型,实现对微博信息的主题聚类;而针对微博信息的外部特征,利用RDF资源描述框架实现对其语义化描述,并依托语义关联发现组件Silk Workbench从时间、地点、人物维度实现了基于主题的微博信息语义发现与多维主题聚合。研究表明,LDA主题挖掘模型与关联数据技术的结合应用为有效揭示社交媒体信息的主题特征,实现对微博信息的细粒度切分、语义化描述与多维度关联聚合提供了一种有效的解决方案。
【关键词】语义关联 社交媒体 新浪微博 信息聚合 主题聚合
【基金】福建省社会科学规划项目“面向政府舆情监测的社会媒体信息主题聚合服务研究”(项目编号:FJ2016B077);; 2017年福建省行政管理学会一般项目“面向行政决策需求的突发事件网络舆情智能监测服务研究”(项目编号:2017B02)的成果
【所属期刊栏目】情报理论与实践
文献传递