标题
  • 标题
  • 作者
  • 关键词

文本自动分类中抽词词典的约简算法研究

2007-09-30分类号:G354

【作者】白振田  侯汉清  
【部门】南京农业大学信息科技学院  南京农业大学信息科技学院 江苏南京210095  江苏南京210095
【摘要】本文借鉴了关键词轮排原理,结合相关统计模型,从正反两个方面对原始抽词词典进行压缩和优选,以达到降维和准确表达主题的目的;并基于海量新闻文本进行了自动分类测试,结果表明该约简算法在构造核心关键词词典方面是可行的。
【关键词】抽词词典  关键词轮排  自动分类  算法
【基金】
【所属期刊栏目】情报理论与实践
文献传递