范例推理在文本自动分类中的应用研究
2007-11-30分类号:TP391.1
【部门】南京信息工程大学计算机与软件学院 安徽师范大学计算机系 江苏南京210044安徽师范大学计算机系 安徽芜湖241000 安徽芜湖241000
【摘要】文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。
【关键词】推理 文本分类 聚类
【基金】安徽省软科学研究项目,项目编号:05035019; 安徽省高校青年教师科研资助项目,项目编号:2005jq1043
【所属期刊栏目】情报理论与实践
文献传递