基于事件要素的组合模型微博热点事件摘要提取
2018-01-08分类号:暂无
【部门】武汉大学信息管理学院
【摘要】[目的/意义]为帮助读者从热点事件产生的海量微博报道中快速了解事件的来龙去脉,提高微博事件摘要的准确性和可读性,提出一种基于事件要素的多模型微博热点事件时间轴摘要提取方法。[方法 /过程]针对微博文本特征,结合主题模型(LDA)与互信息最大熵模型(MaRxEnt?MI)的特点提取事件摘要关键词,以微博传播价值和主题相关性为标准筛选微博,以时间-摘要关键词-摘要微博的形式生成时间轴摘要。[结果/结论]利用人工标注的测试集,与传统的TextRank方法进行对比,F值提高8%-13%,内部测试表明摘要可读性提高
【关键词】文本挖掘 事件摘要 潜在狄利克·雷分布 互信息最大熵模型
【基金】
【所属期刊栏目】图书情报工作
文献传递