基于非相关文献知识发现中的文本挖掘研究

2007-03-30分类号：G350

【作者】张云秋冷伏海

【部门】吉林大学公共卫生学院中国科学院文献情报中心北京100080 中国科学院文献情报中心吉林长春130021 北京100080

【摘要】文本挖掘是基于非相关文献知识发现的核心。本文将文本挖掘的过程细化为从文献源到初始文献集子过程,从初始文献集到中间词集子过程,从中间词集到关联词集子过程。并对每一个子过程中所使用的方法进行分析比较。在此基础上对文本挖掘存在的问题进行分析,并提出改进方法。

【关键词】知识发现文本挖掘非相关文献

【基金】

【所属期刊栏目】情报理论与实践

文献传递