基于主题聚类的主题数字图书馆构建
2008-11-15分类号:G250.76
【部门】南京理工大学信息管理系中国科技信息研究所 中国学术期刊(光盘版)电子杂志社
【摘要】基于主题聚类的主题数字图书馆是针对某一个特定的主题,获取与该主题相关的数字资源集合(本文以文本资源为研究对象),然后再依据主题聚类算法,对该主题的信息资源集合进行聚类,生成可供用户浏览的多层次结构导航,结合全文检索实现基于主题聚类的主题数字图书馆系统。主题数字图书馆系统主要包括主题采集模块、主题聚类模块和数据集成模块,构建过程中主要涉及主题提取、主题聚类以及聚类结果描述等三类关键技术。表2。图1。参考文献20。
【关键词】数字图书馆 主题聚类 主题抽取 文本聚类
【基金】“十一五”国家科技支撑计划重点项目“科技文献信息服务系统关键技术研究及应用示范”子课题(2006BAH03B02;2006BAH03B04); 南京理工大学青年科研扶持基金项目“基于机器学习方法的领域本体学习研究”(JGQN0701); 南京理工大学科研启动基金项目“主题聚类关键技术研究”(AB41123)资助。
【所属期刊栏目】中国图书馆学报
文献传递