文本自动分类中抽词词典的约简算法研究
2007-09-30分类号:G354
【部门】南京农业大学信息科技学院 南京农业大学信息科技学院 江苏南京210095 江苏南京210095
【摘要】本文借鉴了关键词轮排原理,结合相关统计模型,从正反两个方面对原始抽词词典进行压缩和优选,以达到降维和准确表达主题的目的;并基于海量新闻文本进行了自动分类测试,结果表明该约简算法在构造核心关键词词典方面是可行的。
【关键词】抽词词典 关键词轮排 自动分类 算法
【基金】
【所属期刊栏目】情报理论与实践
文献传递