基于非线性规划理论的事件主题词过滤方法
2018-01-24分类号:TP391.1
【部门】中国科学技术信息研究所 中国科学院科技战略咨询研究院
【摘要】本文提出一种基于非线性规划理论的突发事件主题词自动过滤方法。首先以左右邻接熵为主题短语的边界识别依据,选出更具信息量的短语作为候选主题词,然后通过将候选主题词回溯原始文档集合的方式过滤掉部分噪声词,最后采用基于非线性规划理论的函数,对抽取到的候选主题词按权重进行排序,选定更具突发事件类别表征能力的主题词。在几个类别突发事件语料上与传统的TF-IDF算法的对比实验结果说明了本文方法的有效性和实用价值。
【关键词】左右邻接熵 噪声词过滤 非线性规划理论
【基金】国家科技支撑计划项目“面向科技情报分析的信息服务资源开发与支撑技术研究”(2015BAH25F01)
【所属期刊栏目】情报学报
文献传递