面向主题搜索的特征因子研究综述
2012-09-05分类号:G250.73
【部门】解放军艺术学院信息管理中心
【摘要】通过梳理搜索算法中出现的各种特征因子,提出一种更全面的特征因子分类方法,按其自身特点将特征因子划分为6类,分别是文字内容特征、Web拓扑特征、主题分布特征、文档类型特征、统计特征和时效性特征,并描述各特征项对主题相关性的作用、综合运用各类特征的通用化链接优先级计算公式以及特征选取原则。
【关键词】主题爬行技术 主题爬行器 特征因子 搜索算法
【基金】
【所属期刊栏目】图书情报工作
文献传递