基于非相关文献知识发现中的文本挖掘研究
2007-03-30分类号:G350
【部门】吉林大学公共卫生学院 中国科学院文献情报中心 北京100080 中国科学院文献情报中心 吉林长春130021 北京100080
【摘要】文本挖掘是基于非相关文献知识发现的核心。本文将文本挖掘的过程细化为从文献源到初始文献集子过程,从初始文献集到中间词集子过程,从中间词集到关联词集子过程。并对每一个子过程中所使用的方法进行分析比较。在此基础上对文本挖掘存在的问题进行分析,并提出改进方法。
【关键词】知识发现 文本挖掘 非相关文献
【基金】
【所属期刊栏目】情报理论与实践
文献传递