集成概念空间与潜在语义索引的文本聚类检索研究
2009-06-30分类号:G354
【部门】中国科学院国家科学图书馆 中国科学院研究生院 西南大学计算机与信息科学学院
【摘要】信息环境的异构性、动态性与海量性使传统基于自然文本的信息检索方法与技术面临极大挑战,集成概念空间理论与潜在语义索引技术能为这种困境提供一些解决方案。在分析概念空间内涵与特征的基础上,利用潜在语义索引原理讨论了概念提取方法、同义词近义词处理方法及基准向量的生成方法,分析了网络条件下基于概念空间的文本分类、聚类检索基本机制,最后给出了完善概念空间的自学习机制。
【关键词】概念空间 潜在语义索引 文本检索 聚类检索
【基金】
【所属期刊栏目】情报理论与实践
文献传递