一种基于网页信息抽取的OA期刊资源采集方法研究
2017-05-25分类号:G255.2
【部门】中国农业科学院农业信息研究所
【摘要】本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了
【关键词】OA期刊 OA期刊资源采集 网页信息采集 OA期刊资源采集系统
【基金】
【所属期刊栏目】数字图书馆论坛
文献传递