标题
  • 标题
  • 作者
  • 关键词

基于网络安全的网页过滤模型及其关键算法

2011-12-15分类号:TP393.08

【作者】季秀兰  熊拥军  
【部门】江苏食品职业技术学院计算机应用技术系  中南大学信息科学与工程学院  
【摘要】识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出了基于同类词权重均值的关联过滤算法。最后,从两个角度进行算法评估,该过滤算法更为高效,并且能够很好的应对不良网站的反关键字过滤策略。
【关键词】网页过滤  矩阵词典  权重均值
【基金】
【所属期刊栏目】中南林业科技大学学报
文献传递