Web网页识别算法研究
2001-02-24分类号:TP301.6
【部门】中国科学技术大学电子工程与信息科学系!合肥230027 中国科学技术大学电子工程与信息科学系!合肥230027
【摘要】WWW上的文本信息挖掘工作是网络信息处理领域的新课题。本文研究了两种机器学习算法———Rocchio算法和Widrow Hoff算法在Web网页识别领域中的应用 ,并对几种网页识别算法进行了比较分析
【关键词】特征提取 机器学习 WWW 网页识别
【基金】
【所属期刊栏目】情报学报
文献传递