中文网页标引源主题表达能力的调查统计
2002-11-30分类号:G353.2
【部门】南京农业大学信息管理系 南京农业大学信息管理系 南京农业大学信息管理系 南京 210095 南京 210095 南京 210095
【摘要】通过对随机采集的300篇中文经济类网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值,以便为自动标引及人工智能搜索引擎的研制提供数据。
【关键词】汉语 网页 主题标引 加权 自动标引 调查
【基金】
【所属期刊栏目】大学图书馆学报
文献传递