基于控制词集的中文信息动态自动聚类研究
2006-11-21分类号:G354
【部门】北京大学信息管理系 北京大学信息管理系 北京大学信息管理系 北京大学信息管理系 北京大学信息管理系 北京大学信息管理系 北京 100871 北京 100871 北京 100871 北京 100871 北京 100871 北京 100871
【摘要】以专用词典为切分工具,建立以概念为基础的、具有主题分类特点的类目结构是中文信息动态自动聚类的一种适用方式。该文探索了基于控制词集的中文信息动态自动聚类技术,包括专用控制词集的构建,动态有限环境下的自动聚类程序、聚类算法,以及结合控制词集对聚类结果进行优化控制等,最后对实验结果给出了概要评价。
【关键词】动态自动聚类 中文自动分类 专用切分词典 词汇控制
【基金】
【所属期刊栏目】大学图书馆学报
文献传递