汉语文献文外频率加权与逆文献频率加权方法的比较
2007-03-30分类号:G250
【部门】南京农业大学信息科学技术学院 南京农业大学信息科学技术学院 南京农业大学信息科学技术学院 江苏南京210095 江苏南京210095 江苏南京210095
【摘要】本文针对信息表示和信息检索中的文外频率加权和逆文献频率加权进行定量分析。以《软件学报》2004年发表的166篇计算机类的文献为测试集,通过计算机切词,统计词频,分别计算出各种语词加权方式不同的权重,并进行比较分析,得出了逆文献频率加权优于文外频率加权法,对文献频率取对数的逆文献频率加权公式优于不取对数的加权公式的结论。
【关键词】信息检索 加权算法 语词加权 逆文献频率加权
【基金】
【所属期刊栏目】情报理论与实践
文献传递