标题
  • 标题
  • 作者
  • 关键词

基于正则表达式批量提取CNKI文献元数据技术探究

2010-10-05分类号:G353

【作者】曹俊  万晓云  廖顺宝  
【部门】中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室  中国科学院研究生院  
【摘要】介绍一种仅仅依靠中国知网文献磁盘文件提取元数据的方法。根据已下载的CNKI文献提取元数据,构建个人文献信息数据库,进而能建立个人文献信息管理系统。虽然CNKI文献库没有提供外界的数据库访问接口,但是文献的元数据都以web页面的方式展现。通过分析与文献绑定的属性页面的结构,利用正则表达式提取文献元数据,可以将其批量导入到数据库中。
【关键词】CNKI  元数据  正则表达式  批量提取
【基金】资源与环境信息系统国家重点实验室自主研究课题“地球科学数据质量评价研究”(项目编号:O88RA106SA); 中国科学院地理科学与资源研究所创新三期领域前沿项目(地球信息方法论体系)课题“地学数据空间化误差评价方法及案例研究”(项目编号:O66U0309SZ)研究成果之一
【所属期刊栏目】图书情报工作
文献传递