高频词与低频词的界分及词频估算法
1992-03-01分类号:G256
【部门】东北师大图书情报学系
【摘要】齐夫第二定律揭示了低频词的分布规律,给出:I_n,/I_1=2/n(n+1)……(1) 式中,I_n代表文中出现n次的词汇数量。比值与文章长度无关。高频词与低频词分界有个临界值,这是Donohue,J·C·于1973年提出的。其计算公式
【关键词】Zepf's Law——Studies Frequency of terms——Calculations Document metrology——Theories
【基金】
【所属期刊栏目】中国图书馆学报
文献传递