基于hLDA的科技文献主题摘要生成算法与实现——以电力行业论文为例
2014-07-10分类号:TP391.1;F426.61
【部门】南方电网科学研究院 武汉大学信息管理学院
【摘要】随着信息爆炸时代的到来,科技文献数量的快速增长,科技工作者对于科技文献有效信息获取的要求也越来越高。本文提出了一种科技文献主题自动摘要生成算法。利用hLDA模型对科技文献数据集进行主题建模,并通过摘要候选句的选择,综合多个因素的句子打分策略,自动为科技文献中潜在的主题生成摘要。在实验中,提出基于主题覆盖度的摘要评价方法。实验结果验证了本文提出的主题摘要生成算法的有效性。
【关键词】科技文献 主题摘要 生成算法 hLDA
【基金】国家自然科学基金项目“多因素融合下的微博话题可信度评估模型及实证研究”(71303179)的成果之一
【所属期刊栏目】图书情报知识
文献传递