面向科学研究主题的文献隐含时间信息分析与挖掘
2017-04-24分类号:G353.1
【部门】南京理工大学 武汉理工大学中国应急管理研究中心
【摘要】本研究针对缺乏检索对象时间范围和精确语义表达式的用户弱信息检索需求,为了更好地体现出文献之间的时间关联性,提出了一种文本内容时间信息的分析和挖掘方法。本文归纳总结了学术文献常用时间词,并基于图书情报学题录信息完成文本时间词抽取。在此基础上利用标签主题模型1abe1ed-LDA实现文本隐含时间标签的生成,以及基于时间维度的文本语义相似度计算。实验结果表明,本研究能较好地生成文献隐含时间信息,也能更有效地帮助用户提高弱信息检索结果的相关性。
【关键词】标签主题模型 隐含时间特征 文本挖掘 标签生成
【基金】国家自然科学基金青年项目“基于时间感知模型的学术主题检索与演化挖掘研究”(71503124);国家自然科学基金项目“突发事件网络舆情演变过程中的人群仿真研究”(71273132)
【所属期刊栏目】情报学报
文献传递