一种基于TFIDF方法的中文关键词抽取算法
2008-03-30分类号:TP391.1
【部门】西安电子科技大学经济管理学院 西安电子科技大学经济管理学院 陕西西安710071 陕西西安710071
【摘要】本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法。该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词。通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著。
【关键词】关键词抽取 向量空间模型 算法
【基金】
【所属期刊栏目】情报理论与实践
文献传递