基于特殊主题的PageRank改进算法
2012-11-05分类号:TP393.092
【部门】赣南师范学院图书馆
【摘要】在传统PageRank算法的基础上进行一些优化与改进,提出一种新的主题敏感的PageRank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为PageRank算法加入时间因子来防止PageRank偏重旧网页的问题,加入站内外区分因子来防止针对PageRank算法作弊的行为。改进算法弥补了原算法的不足,提高了主题搜索的效率。
【关键词】主题漂移 PageRank算法 领域向量 锚文本
【基金】
【所属期刊栏目】图书情报工作
文献传递